浅谈高校数字图书馆信息数字化建设中的问题及对策
,还能实现各种校对,然而,对于馆藏文献的数字化而言,由于汉字的复杂性,OCR对各类中文文献的识别远难于对英文和数字的识别,特别对含有繁体手写汉字的古籍文献、简繁混排的中文文献、专业性强的中文文献以及难于机检的汉字文献。OCR技术目前还存在很大的误识率和拒识率,为此,需要对OCR系统进行深入的研究和改进,提高其应用的全面性,并要引入中文校对、录入质量控制等技术,从而加强其管理功能。
2.4标准与规范问题
目前,在信息数字化标准规范方面存在的问题主要有:①缺乏对标准规范重要性的认识;②缺乏普遍接受和广泛应用的关键标准规范;③缺乏对标准规范建设的系统化把握;④缺乏对标准规范的开放描述和开放应用;⑤缺乏开放、联合、共享的标准规范建设与应用机制,例如图书馆在信息资源建设过程中所采用的软件系统差异很大,如ILAS系统、图书馆集成系统等,其标准和格式都不一致,导致开发的数据库不能兼容,检索界面不一,检索途径也不同,检索语言也无统一的规范控制,无法在网上实现资源共享。
3信息数字化发展对策
3.1加强特色数字馆藏建设
只有具有特色的数据才能赢得较高的网络访问频率,才具有资源共享的价值,也是各大数字图书馆以最小投入换取最大效益的文献信息共享模式。因此,在进行本馆的信息数字化建设时,除了需要全面考虑文献价值、用户需求、载体形态、技术可行性和著作版权等一般因素外,还需要科学而系统地考虑馆藏内容、馆藏特色,尤其是馆藏结构和馆藏级别。馆藏级别一般可以划分为永久保存级、服务级、镜像级和链接级4个基本层次。永久保存级馆藏是指具有确定的保存价值和用途,并具有惟一性的特色文献;服务级馆藏是指十分有用和必须的虚拟馆藏;镜像级馆藏是指其他数字图书馆馆藏的拷贝,与永久保存级相同的是它们都是现实馆藏,与之不同的是它缺乏惟一性;链接级馆藏则是贮存于其他数字图书馆中的数字化信息资源,其内容较为广泛,与服务级馆藏相比,它与用户的相关性要低一些。只有通过这些特色数字馆藏的建设,才能真正优化馆藏文献的结构,加快馆藏信息利用,最大限度地避免重复建设,从而提高整个社会文献资源的保障水平和信息资源的开发利用效率。
3.2从信息源头加快信息数字化建设
文献信息资源的源头在出版社和出版商,每年都有数以万计的文献资源被出版系统数字化,这个资源如能加以利用,将是一笔
2.4标准与规范问题
目前,在信息数字化标准规范方面存在的问题主要有:①缺乏对标准规范重要性的认识;②缺乏普遍接受和广泛应用的关键标准规范;③缺乏对标准规范建设的系统化把握;④缺乏对标准规范的开放描述和开放应用;⑤缺乏开放、联合、共享的标准规范建设与应用机制,例如图书馆在信息资源建设过程中所采用的软件系统差异很大,如ILAS系统、图书馆集成系统等,其标准和格式都不一致,导致开发的数据库不能兼容,检索界面不一,检索途径也不同,检索语言也无统一的规范控制,无法在网上实现资源共享。
3信息数字化发展对策
3.1加强特色数字馆藏建设
只有具有特色的数据才能赢得较高的网络访问频率,才具有资源共享的价值,也是各大数字图书馆以最小投入换取最大效益的文献信息共享模式。因此,在进行本馆的信息数字化建设时,除了需要全面考虑文献价值、用户需求、载体形态、技术可行性和著作版权等一般因素外,还需要科学而系统地考虑馆藏内容、馆藏特色,尤其是馆藏结构和馆藏级别。馆藏级别一般可以划分为永久保存级、服务级、镜像级和链接级4个基本层次。永久保存级馆藏是指具有确定的保存价值和用途,并具有惟一性的特色文献;服务级馆藏是指十分有用和必须的虚拟馆藏;镜像级馆藏是指其他数字图书馆馆藏的拷贝,与永久保存级相同的是它们都是现实馆藏,与之不同的是它缺乏惟一性;链接级馆藏则是贮存于其他数字图书馆中的数字化信息资源,其内容较为广泛,与服务级馆藏相比,它与用户的相关性要低一些。只有通过这些特色数字馆藏的建设,才能真正优化馆藏文献的结构,加快馆藏信息利用,最大限度地避免重复建设,从而提高整个社会文献资源的保障水平和信息资源的开发利用效率。
3.2从信息源头加快信息数字化建设
文献信息资源的源头在出版社和出版商,每年都有数以万计的文献资源被出版系统数字化,这个资源如能加以利用,将是一笔