一、 什么是数字图书馆
数字图书馆就是一个不需要阅览室的图书馆,只要有网络存在的地方,任何人都可以随时随地查阅资料、获取信息。
数字图书馆系统是现代计算机及网络技术与传统图书馆信息检索技术相融合的结晶。传统图书馆管理面临着技术与设备的落后的局面,但是长期针对海量数据的管理积累了丰富的信息检索经验;
数字化**和因特网的大发展,带来了经济、贸易、信息传播的全球化,深刻影响着社会的各个层面。巨量信息涌入因特网,使其信息极为丰富,也使信息查询、检索十分困难,尤其是对于上网漫游的新手更是如此。这主要是由于因特网上的信息资源很大程度上处于混乱的无*状态,大大影响了信息利用的效率。这一重大的弊端,清楚地表明了在因特网这种全球信息服务网络中,急需一个管理信息资源的新模式,所有上网的资源必须按照这个模式统一管理。这就是提出数字图书馆的主要背景。
数字图书馆是采用现代高新技术所支持的数字信息资源系统,是下一代因特网网上信息资源的管理模式,它将从根本上改变目前因特网上信息分散不便使用的现状。
数字图书馆建设是以统一的标准和规范为基础,以数字化的各种信息为底层,以分布式海量资源库群为支撑,以智能检索技术为手段,以电子商务为管理方式,以宽带高速网络为传输通道,将丰富多彩的多媒体信息传递到千家万户。它涉及数字信息资源的生产、加工、存储、检索、传递、保护、利用、归档、剔除等全过程。它不是个别图书馆所能完成的任务,需要全国范围的图书馆、博物馆、美术馆、档案馆和情报信息提供单位等携手共同完成。
在数字图书馆概念出现之前,人们从电子图书馆、无围墙图书馆和数字化图书馆等不同侧面讨论了图书馆的未来发展。电子图书馆主要是指以电子形式(媒介)存贮、传递并提供服务的图书馆,如各个图书馆建立的电子阅览室、OPAC检索等,它重点强调个别图书馆借助于计算机技术在一定范围内提供读者服务。无围墙图书馆是指读者通过网络通信系统检索多个图书馆的数字化馆藏,强调用户获取信息的广泛性和网络传输的重要性。而数字化图书馆则主要侧重于馆藏的数字化,将数字化的书刊文献上网提供读者使用。可以看出,电子图书馆主要侧重在个别图书馆的电子化检索,无围墙图书馆主要强调通过网络检索多个图书馆的馆藏,而数字化图书馆的重点则在馆藏的数字化。电子图书馆、虚拟图书馆和数字化图书馆的建设难度、使用的方便程度都远远不如数字图书馆,但它们是数字图书馆的基础,是建设数字图书馆必不可少的前期准备工作。
现代网络计算经过互连网时代的飞速发展,在信息的数字化技术、多媒体技术、信息的存储与安全、网络发布与搜索技术等方面日趋成熟,但是面临海量信息的管理暴露出诸多问题,如何将两者有机地结合,是数字图书馆系统设计的关键。
二、建设数字图书馆的意义
1.对社会发展的意义
传统的纸张作为信息媒介存在着巨大的资源浪费,以图书为例,大量的有用和没用的信息都要印刷出成千上万册,经过存储、运输、批发、销售等耗资巨大的环节后送到读者面前,然后无论是买出去还是没买出去的图书无非都是两种结果,束之高阁直至发霉腐烂,或者再耗费人力物力进行销毁。
这样不仅一方面社会资源和自然资源被严重浪费,另一方面信息无法永久保存,更谈不上信息的增殖。而随着人类社会需求的发展和信息的膨胀,为传统纸媒介所做的信息移植的代价越来越大。下图为传统信息传播方式和Internet时代信息传播方式的比较。
数字图书馆的建设具有以下社会经济意义:
知识经济的基础建设;
带动相关信息资源;
全球文化科技竞争的焦点;
可观的效益前景--信息增值和知识创新。
2.对国家的战略意义
数字图书馆已经成为国际高科技竞争中新的制高点,同时也成为一个国家信息基础设施建设的重要标志。与数字图书馆相关的工程项目层出不穷,各国在数字图书馆建设方面的投资力度也逐年加大。
美国从20世纪90年代初就把数字图书馆作为新兴的有发展潜力的重要研究领域,并把数字图书馆研究纳入克林顿*所倡导的国家信息基础设施计划(NII)。1994年至1998年,美国共动用7800万美元,调集国防部、国家宇航局、联邦调查局、国会图书馆、国家科学基金会、人文科学基金会等重要部门,联合数十所大学和研究机构,大力研究和推广数字图书馆项目,预计在今后的几年中,这一计划还将动用上亿美元的投入。美国实施数字图书馆计划的主要目的就是要促进美国社会各类信息的高效传递,为美国公民的终身学习提供保障,使美国在知识生产和信息发布方面充当国际霸主,并利用互联网尽快占领信息资源的战略制高点。这一做法引起国际社会的高度重视,英国、法国、日本、德国、意大利等西方发达国家和新加坡、韩国等亚洲国家也先后步其后尘紧紧追赶。
尽管我们国家起步较晚,但在基础研发上,我们已经不落后了。相对于技术的研发来讲,在我国进行数字图书馆的推广方面,却要遇到很多非技术层面的难处。目前,最大的问题是社会各界对数字图书馆的重要意义还认识不够,有关部门(特别是核心部门)参与的程度还不是很高,资金投入力度还很不够。
在互联网时代的信息角逐中,拥有它,就是拥有了一块中文阵地,失去它,可能将意味着失去整个中文世界。
◆文档信息化系统的特点
实用的文档信息化系统具有以下特点:
本身是一套集成最新技术的商业实现;
自动化加工过程,解决海量图书的数据化;
实现安全控制和版权保护;
可以基于internet的商务模式;
良好的开放性,和已有系统的集成。
文档信息化系统有三个要素:
1.数字化资源
大量的数字化资源是数字图书馆的“物质”基础。数字图书馆的目的是直接提供读者所需的最终信息,而不只是二次文献(获得文献的线索),但数字图书馆并不排斥书目数据,索引文摘等二次文献,因而它们也是数字图书馆的组成部分。
万千世界统一于数字图书馆中的0和1,书籍、期刊、录音录像带、乃至古籍善本、稀世字画甚至X光片,都消失了原本的物理形态,只要有相同的属性,就能被同时获取。因此多媒体也是数字图书馆的一个基本特征。
2.网络化存取
高速的数字通信网络是数字图书馆的存在基础,数字图书馆依附于网络而存在,其对内的业务组织和对外的服务都是以网络为载体,得益于网络也受制于网络,只有利用网络至极限,才能发挥数字图书馆作用至极限。
数字图书馆内部本身由局域网构成,一般是高速主干联接数台服务器及工作站,外部通过数台广域网服务器面向浩瀚的国际互联网,今天是Internet,明天可能是Internet2。
3.分布式管理
分布式管理是数字图书馆发展的高级阶段,它意味着全球数字图书馆遵循统一的访问协议之后,数字图书馆可以实现“联邦检索”,全球数字图书馆将像现在的INTERNET联接网站一样,把全球的数字化资源联为一体,联接成为一个巨大的图书馆。
分布式管理之所以是数字图书馆的基本要素,在于它强调标准协议的重要性,只有全球共同遵循TCP/IP协议,才有INTERNET的今天,数字图书馆技术还没有这样一个公认的标准协议,,因此技术标准的选择和参与制订,对每一个数字图书馆先驱者来说都是至关重要的。
◆典型的信息化系统
1.文档加工系统的组成
由三部分组成:
信息化处理
本地阅读
internet电子商务平台
2.系统的特点:适应中国国情--图像技术
形式:图象/文本
特点:
象形文字
简繁多码
版式的保存
原件的法律效应
◆图像压缩及处理方式
通用图像压缩:CCITT G4和JPEG;
黑白二值图的压缩:JBIG和JBIG2
进一步的压缩技术:小波变换;
新的图像压缩标准:JPEG2000;
图像的优化技术:去污、去噪、纠偏等等;
视频动态压缩:MPEG、MPEG2、MPEG4、MPEG7、H.261;
音频动态压缩:MP3。
◆信息的深加工过程:识别和检索
加工系统:各种非数字化对象的数字化处理,同时完成数据对象的索引(index)和置标(markup)处理;
查询检索系统:通过基于SGML的搜索引擎,实现元数据检索及内容的全文检索。
1.文档信息化处理流程
在向internet方式的信息传输的过渡时,将传统的纸媒介信息数据化是一项艰巨的任务,其中涉及到的扫描、压缩、加密等一系列技术难关。
2.信息的入口:捷易拍文件拍摄仪
拍摄速度(30-180页/分钟)
保持原件效果
图像去噪处理
◆图书的格式
图书文件的格式为按照PDF格式组织的图像文件,所以可以利用PDF和Acrobat Reader的优势。
PDF特点:
支持排版格式
支持对象定义
支持图书发布控制
支持安全加密
在线浏览的优化
图文混排
◆图书的阅读
阅读平台不仅提供图书的显示,还应能够将上述的技术实现进行集成。选择PDF的理由是Acrobat Reader具有以下特点:
支持图文及多媒体对象
支持全文检索
支持页、目录等管理
支持各种操作及控制
可以集成多种技术
◆系统结构的开放性
1) 和已有系统的连接
联机编目系统
查询检索系统
业务管理系统
2)各种技术的嵌入
OCR识别模块
数字水印功能
加盖时间戳
3)第三方功能的嵌入
◆数字文档的安全控制
要作到对出版物版权的保护,应结合最新的认证和加密技术,对每一个用户的下载图书进行不同的加密。
信息安全:
认证
电子签名(水印)
存取权限
加密
操作权限控制:
阅读
修改
打印
下载
◆数字文档的版权保护:加密与绑定
本系统解决数据对象的流通、传播和增值,以及安全和版权的保护等问题。
◆系统应用
1.文档信息化系统构成了未来图书的商务与服务模式
2.文档信息化系统可用于图书网站建设
电子商务平台+多家出版社联合/同盟=电子图书销售中心
3.数字图书加工、销售与图书网站建设的一个全面解决方案
◆文档信息化系统在办公自动化方面的应用
○*:公文、文件、档案、材料
○工商:企业档案、申报材料、检查记录
○税务:企业情况、纳税登记、发票
○银行:企业及个人证件、印鉴、支票、单据
○司法:企业原始材料、卷宗、证词、案例
○文物:书画、真迹、图片、
○出版:图书、手稿
○企业:档案
◆提供的服务模式
◆市场的预测
这是一个保守估计,依据是CNNIC1999年的调查:
1999年6月30日中国上网用户400万,12月30日上网用户数890万。半年的增长率是100%。
假设年增长率100%,1/4用户在网上看书,1/8用户在网上购买电子书。