【文件属性】:
文件名称:SearchEngine:信息检索作业5
文件大小:601KB
文件格式:ZIP
更新时间:2021-06-24 19:44:53
Java
搜索引擎
信息检索作业5
给定语料库创建倒排索引。
使用 BM25 Ranking 对文档进行排名。*
允许根据排名查询和返回结果。
使用步骤:
确保“tcorpus.txt”和“queries.txt”与 SearchEngine.java、TermFrequency.java 和 BM25.java 文件位于同一目录中。
从终端运行“javac *.java”
运行“java 搜索引擎”。 java程序会读取tcorpus.txt中的语料库和querys.txt中的查询,然后输出到7个不同的查询文件中(这是为了可读性)
享受!
*教授提到我们的排名略有下降。 我们从这个项目继续前进,所以没有看为什么。
【文件预览】:
SearchEngine-master
----.gitattributes(483B)
----queries.txt(228B)
----TermFrequency.java(2KB)
----SearchEngine.java(8KB)
----BM25.java(1KB)
----tccorpus.txt(1.79MB)
----README.md(720B)
----.gitignore(606B)