一、信息与信息管理
1.信息
概念:①信息是用来减少不确定性的东西(香农) ②信息是负熵(维纳) ③事物存在的方式和运动状态的表现形式(本体论) ④主体所感知或表述的事物存在的方式和运动状态(认识论)
特征:①普遍性客观性 ②信息产生的广泛性和无限性 ③时间和空间上传递性 ④对载体的独立性 ⑤对认识主体的相对性 ⑥对使用者的共享性 ⑦时效性 ⑧可伪性
信息链:事实→数据→信息→知识→智慧 数据+背景=信息 信息+经验=知识
2.信息化与信息社会
信息化:人类社会发展中对信息依赖程度增加而对物质能量依赖减小,包括生产工具信息化、生产力信息化、生活信息化三个层次
信息社会:继农业社会、工业社会后的社会,信息为主要资源,主导社会发展
3.信息管理
概念:人类采用各种手段对信息流进行控制提高利用效率,最大化信息价值,对象包括信息资源、信息活动
任务:①宏观:信息开发战略、法规、明确权责、基础设施建设 ②微观:调查各部信息需求、整理内外信息渠道、建设信息系统、评价信息管理绩效
人类社会信息过程:信息流由两条渠道流从生产者流入利用者,一条是直接流入,一条是在信息系统控制下流入
信息管理流程:信息生命周期管理ILM:信息创建→采集→组织→存储→利用→清理(销毁/回收)
二、信息交流
1.基本概念
不同时间空间上认知主体间的信息传递,包括共时信息交流与历时信息交流(是否在一个时间截面),由生产者到接收者单向传递
2.模式
①香农通信模型
②拉斯韦尔5W模式
③施拉姆模型:交流双方需要共同经验,且交流循环往复
3.机制
信息传播的栈模式:信息从发送者出发可能经过信息栈(如图书馆档案馆书店等,包括空间栈和时间栈)最后到达接收者
(下图中上为直接交流,下为社会代理交流)
信息失真原因:物理失真,语义改变,语用衰减
信息传递模式:①多向主动传递(S对整个社会未确定R发送) ②单向主动传递(S在了解用户需求情况下传给确定的R) ③多向被动传递(事先不确定的用户点击获取信息) ④单向被动传递(R向S咨询)
三、信息分布
1.信息产生和分布中的马太效应
马太效应:信息表现出的核心趋势和集中取向(如高产作者群体、高频词汇、高被引论文等),有助于高效利用信息资源,但也可能导致忽略其他信息的价值和限制新人成长
数学模型:①普利亚(Polya)模型 ②塔格分布 ③威布尔分布
2.信息内容的离散分布规律
布拉德福定律:如果将科技期刊按刊载某专业论文数量递减排序,所含论文数量相等(1/3)的核心期刊与后面两个区的期刊数量呈1:n:n2 关系
齐夫定律:在一篇较长文章中,f为词汇频次,r为频次排序,则有frb=c
3.信息生产者分布规律
洛特卡定律:论文数x,作者数yx ,则有xnyx=c ,n在2附近波动
令f(yx)为写x篇论文的作者占比,C=c/Σyx (Σyx为作者总数),则有f(yx)=C/x2
普赖斯定律:某一特定领域中,全部论文的一半由全部作者的平方根撰写
4.信息对时间分布规律
指数增长律:①普赖斯曲线:文献增长与时间呈指数关系,t时刻文献量F(t)=aebt ,λ∈[0,1]为文献质量级别,则不同级别的文献量为 [F(t)]λ
②生长曲线:文献信息增长趋近于生物生长曲线(S型) F(t)=k1+ae-kbt F(t)为t时刻文献量,k为文献量最大增长值 (早期文献符合指数增长,但k/2之后增长率将减小)
逐渐过时率:随时间推移,信息价值逐渐衰减直至失效;可用半衰期或普赖斯指数(5年内引用数/总引用数)衡量
四、信息获取
1.信息源
概念:人们活动中产生的成果及原始记录,或对其整理的的成果
分类:记录型,实物型(样品,工艺品等),智力型(隐性知识),零次信息源(直接交流)
2.信息评价与选择
评价指标:及时性,准确性,综合性,易获取性,经济性,符合需求
评价方法:①直接法(信息工作者对信息源按各指标评分评价)
②间接法(通过信息用户评价信息源),可考虑指标包括评分平均值、评分比重(该信息源评分和 / 所有被访者对所有信息源评分和)、最高评分频度(该信息源给最高评分人数占比)、平均名次(各被访者对所有信息源排名次)
3.信息获取途径
途径:采购,调查,交换,索取,检索
原则:针对性(避免盲目),系统性(避免支离破碎),预见性,科学性(科学方法),计划性
效率指标:①采全率:P=r/R(r为采取到的切题信息,R为全部切题信息) ②采准率:E=r/Q(Q为采取到的所有信息) ③及时率:T=i=1nti(衡量信息搜集速度,i为环节数) ④费用率:C=F/G(衡量资金效率,F为总花费,G为搜到信息量) ⑤劳动耗费率:L=i=1ηli (L为总劳动花费)
五、信息组织
1.信息组织基本概念
概念:利用一定规则方法对信息的外部特征和内容特征进行描述;外部特征如载体物理形态、题名、出版日期、流通标记等,内部特征可由关键词、主题词等表达
基本内容:信息选择,信息分析,信息描述与揭示,信息存储
2.信息组织方法
分类法:按事物属性特征进行区分和类聚,并将区分结果按次序组织(例如杜威十进制分类法、国际十进制分类法、中国图书馆分类法、国会图书馆分类法、冒号分类法)
主题法:直接以表示信息资源主体的词语作标识,提供字顺检索,并揭示词间关系用于检索;包括标题法(以标题作为主题标识)、单元词法(用标引信息资源的最基本不可分的单元词组配)、叙词法(严格规范化词语组配标识)、关键词法(文献标题、摘要、正文中对描述文献主题有实际意义的词语)
分类-主题一体化:两种结合,如中国分类主题词表
3.信息描述揭示
信息标引:分析信息对象内外属性,并用特定语言表达分析结果,作为信息存储和信息检索依据
标引语言:①机器可读目录MARC(由许多数据项组成,包括各种外部特征和提要) ②元数据(专门描述数据特征属性,如都柏林核心集)
通用标记语言标准:SGML,HTML,XML,MARC XML
4.网络信息组织
组织方法:分类法,主题法,基于本体方法(通过语义网五层模型构建人机相互理解的通道)
组织方式:文件、数据库、主题树、超媒体
Web2.0组织技术:Blog,RSS,Wiki,Tag
5.知识组织
概念:揭示知识单元(包括显性、隐性),挖掘知识关联的过程或行为,以快速提供知识信息
知识表示:①主观表示(逻辑法,产生式规则法,语义网,框架法,面向对象知识表示) ②客观法(分类标引,主题标引)
知识组织技术:分类法,主题法,数据仓库,知识挖掘(联机分析处理,知识发现,数据挖掘),主题图
六、信息检索
1.信息检索基本概念
概念:将信息按照一定方式组织和存储起来,并根据用户需要找出相关信息
模型:①布尔逻辑检索模型(基于经典集合论) ②向量空间检索模型(检索词和检索文档都转换为空间向量) ③概率检索模型(根据检索词估计目标集合的特征) ③模糊检索模型(以隶属度结合集合论)
2.信息检索技术
手工信息检索:目录,索引,文摘,年鉴,手册,百科全书
机械信息检索:机电信息检索系统(手T穿孔卡),光电信息检索系统(使用缩微胶卷)
计算机信息检索:联机信息检索,光盘信息检索
网络信息检索:非web类(FTP,Telnet,基于菜单式检索),web类(搜索引擎(综合型独立搜索,垂直型独立搜索,元搜索),目录型检索,混合型检索)
七、信息服务
1.信息服务基本概念
概念:使信息有序化使之可用 / 对用户信息需求研究,并提供相应有价值信息
类型:信息检索传递,信息报道发布,参考,信息咨询
2.信息用户特征
信息需求理论:①意义构建理论:用户信息需求随所处时空改变,也随抽象思维改变而改变
②知识非常态理论:用户在需要知识时却不能理解和描述自身信息需求
用户信息行为规律:①用户信息需求重要性取决于信息价值大小 ②用户寻求信息流程:个人资料库→非正规渠道→信息系统或中心,且信任程度递减(信息易用性和可获得性决定) ③用户对信息需求更快更新 ④用户信息咨询时可能出现表达需求小于实际需求,或表达的需求是用户认为对方能够提供的而非自身需要的
信息用户研究:用户构成,用户信息需求调查,用户信息心理规律研究,用户信息效用及吸收信息机理,用户信息活动相关因素,用户信息保证(信息服务系统化)
八、信息系统
1.信息系统基本概念
概念:提供信息服务的计算机应用系统
组成:计算机硬件系统,计算机软件系统,数据及存储介质,通信系统,非计算机设备,规章制度,工作人员
功能:输入,存储,处理,输出,控制(保证各部分有效运行)
发展阶段:诺兰模型
类型:事务处理系统(基础业务),管理信息系统(中层),决策支持系统(高层)
2.信息系统开发
系统开发生命周期:计划,分析,设计,开发,测试,实施,维护
系统开发方法:结构化生命周期法(逐步分析拆解子系统及模块),原型法(迅速开发原型后协商修改),面向对象方法(对问题涉及的对象进行分析编程),计算机辅助软件工程方法(在软件支持下开发)
3.信息系统管理
信息系统质量管理:可用性,正确性(可靠、准确、安全),适应性(兼容、扩充、维护)
信息系统运行与维护管理:系统例行检查,系统运行情况记录积累;应用程序维护,数据维护,代码维护,硬件维护,机构人员变动
信息系统评价:主观评价法(指标权重专家评价法),客观评价法(技术接受模型TAM,任务技术匹配模型TTF)
4.信息系统安全
信息系统安全:信息安全,计算机安全,网络安全,通信安全
信息系统安全体系结构:基于协议,基于实体(应用实体、服务实体等),基于对象(对象技术),基于代理(软件代理技术)
信息系统安全技术:数据加密,身份认证,防火墙,交换式虚拟局域网,数据安全存储,漏洞检测