文件名称:走进搜索引擎(中) 作者:梁斌 编著
文件大小:6.16MB
文件格式:PDF
更新时间:2014-01-10 05:29:16
走进搜索引擎 (中) 作者:梁斌 编著
第五章搜索引擎的索引系统 第一节知识准备 信息 索引 倒排索引、倒排表、临时倒排文件、最终倒排文件 其他概念 第二节全文检索 全文检索 第三节文档编号 编号的本质 文档编号的方法 游程编码 第四节倒排索引 经典的倒排索引 正排索引(前向索引) 倒排索引 第五节数据规模的估计 齐普夫法则 布尔检索模型下的索引规模估计★ 第六节涉及存储规模的一些计算 正排表与倒排表的合并 多个临时倒排文件的归并 倒排索引分布式存储 倒排文件缓存 倒排索引词典统计信息的计算 第七节倒排索引文件的创建过程 创建倒排表 计算统计信息 参考文献 第六章搜索引擎的查询系统 第一节知识准备 什么是信息熵 检索和查询的区别 检索词和查询词的区别 自动文本摘要(AutomaticTextSummarization) 第二节网页信息检索 早期的检索模型 向量空间模型(VectorSpaceModels) 关键词权重的量化方法TF/IDF★ 搜索引擎采用的检索模型 多文档列表求交计算 检索结果排序 堆排序 第三节中文自动摘要 自动摘要的发展历史 自动摘要的含义和实现 第四节生成搜索结果页 生成搜索结果页 第五节搜索结果页的缓存 搜索结果页的缓存 第六节推测用户查询意图 查询分类 推测信息类、事物类的查询意图 第七节查询系统的当前热点和发展方向 查询系统的当前热点 参考文献