文件名称:BooleanRetrival_PostingLists:建立倒排索引(reverted index);倒排索引表的合并
文件大小:417KB
文件格式:ZIP
更新时间:2024-05-19 02:29:52
java information-retrieval Java
Boolean Retrival(布尔检索) and Posting Lists(倒排索引表) 问题描述 利用文档和词项的布尔关系建立倒排索引表,根据倒排索引表进行布尔表达式查询.这里只实现AND操作. 布尔检索 布尔检索模型React了文档和词项集合的关系 布尔检索模型为一个关于词项-文档关联的二维矩阵,其中每一行表示一个词(term),每列表示一个文档(document).当词t在文档d中存在时,矩阵元素(t,d)的值为1,否则为0 倒排索引 每个词项都有一个记录出现该词项所有文档的列表,该表中的每个元素记录的时词项在某个文档中的一次出现信息(有时候还会包括词项在文档中出现的位置),这个表中的每个元素通常称为倒排记录(posting).每个词项对应的整个表称为倒排索引表(posting list). 建立过程 对每篇文档建立索引时的输入为一个归一化的词条表,也可以看成二元组(词项,文档
【文件预览】:
BooleanRetrival_PostingLists-master
----pic3.png(171KB)
----pic1.png(25KB)
----pic4.png(102KB)
----pic5.png(88KB)
----pic2.png(29KB)
----BoolRetrival.java(5KB)
----README.md(4KB)