文件名称:高性能网页索引器JU_Indexer 的实现 (2006年)
文件大小:440KB
文件格式:PDF
更新时间:2024-05-30 05:06:15
自然科学 论文
高性能网页索引器JU_Indexer 用倒排索引表存储网页索引数据,以多线程并行的方式对网页建立索引数据,采用经过优化的检索算法实现用户的查询。首先给出了JU_Indexer的系统框架,然后描述了索引数据在JU_Indexer中的存储结构、建立网页索引的算法、以及实现用户查询的检索算法。实验结果表明,JU_Indexer能在毫秒级的时间内完成用户的查询,它采用的经过优化的词组检索算法缩短了词组的检索时间。