走进搜索引擎(中) 作者:梁斌 编著

时间:2014-01-10 05:29:16
【文件属性】:

文件名称:走进搜索引擎(中) 作者:梁斌 编著

文件大小:6.16MB

文件格式:PDF

更新时间:2014-01-10 05:29:16

走进搜索引擎 (中) 作者:梁斌 编著

第五章搜索引擎的索引系统   第一节知识准备   信息   索引   倒排索引、倒排表、临时倒排文件、最终倒排文件   其他概念   第二节全文检索   全文检索   第三节文档编号   编号的本质   文档编号的方法   游程编码   第四节倒排索引   经典的倒排索引   正排索引(前向索引)   倒排索引   第五节数据规模的估计   齐普夫法则   布尔检索模型下的索引规模估计★   第六节涉及存储规模的一些计算   正排表与倒排表的合并   多个临时倒排文件的归并   倒排索引分布式存储   倒排文件缓存   倒排索引词典统计信息的计算   第七节倒排索引文件的创建过程   创建倒排表   计算统计信息   参考文献   第六章搜索引擎的查询系统   第一节知识准备   什么是信息熵   检索和查询的区别   检索词和查询词的区别   自动文本摘要(AutomaticTextSummarization)   第二节网页信息检索   早期的检索模型   向量空间模型(VectorSpaceModels)   关键词权重的量化方法TF/IDF★   搜索引擎采用的检索模型   多文档列表求交计算   检索结果排序   堆排序   第三节中文自动摘要   自动摘要的发展历史   自动摘要的含义和实现   第四节生成搜索结果页   生成搜索结果页   第五节搜索结果页的缓存   搜索结果页的缓存   第六节推测用户查询意图   查询分类   推测信息类、事物类的查询意图   第七节查询系统的当前热点和发展方向   查询系统的当前热点   参考文献


网友评论

  • 非常有利于初学者获知全面的认识
  • 书不错,记得08年的时候,再做搜索引擎相关的项目时,读过该书,适合搜索引擎初学者学习。