daat-query-processing:使用 WAND 优化进行一次文档查询处理

时间:2024-06-30 21:28:38
【文件属性】:

文件名称:daat-query-processing:使用 WAND 优化进行一次文档查询处理

文件大小:227KB

文件格式:ZIP

更新时间:2024-06-30 21:28:38

Java

使用 WAND 优化进行一次文档 (DAAT) 查询处理 特别是,对于每个查询,从索引中获取与查询词相对应的发布列表(从磁盘中)。 然后,作为假定的析取语义(这意味着计算每个文档的排名分数,其中至少包括一个查询词),首先进行典型的 DAAT 处理,直到前 k 个文档被评分并插入到堆中。 从这点开始,有人可以切换到 WAND 处理,这意味着一个文档的分数只有在它可以超过基于 term upper-bounds 的分数阈值(即堆中的最小分数)时才计算; 否则,跳过。 计算每个查询评估和跳过的发布元素的计数,报告查询集的平均计数。 数据文件: 字典文件: 对于每一行 [string token] [int length-of-postings-list] [float precomputed-idf] 查询文件: 每一行都是一个[字符串查询] 矢量长度文件: 对于每一行 [int


【文件预览】:
daat-query-processing-master
----src()
--------Document.java(1KB)
--------Dictionary.java(438B)
--------Query.java(1KB)
--------Term.java(2KB)
--------Analyzer.java(1KB)
--------Posting.java(961B)
--------Parser.java(6KB)
--------Heap.java(4KB)
--------QueryProcessor.java(13KB)
----LICENSE(18KB)
----README.md(1KB)
----docs()
--------report.pdf(215KB)
----.gitignore(45B)

网友评论