ranking_search_results:给定一些查询和相应的搜索结果,我们对结果进行排名

时间:2024-05-30 01:49:08
【文件属性】:

文件名称:ranking_search_results:给定一些查询和相应的搜索结果,我们对结果进行排名

文件大小:4.01MB

文件格式:ZIP

更新时间:2024-05-30 01:49:08

Java

##排名搜索结果: 实现三种不同的排名功能,并使用NDCG指标评估排名功能的有效性。 用于排序功能的参数的估计是手动完成的。 余弦相似度:实现了余弦相似度的变体(具有L1-范数)作为排名函数。 这本质上涉及构造文档向量和查询向量,然后取其点积。 BM25F:实现了BM25F排名算法。 最小窗口:将窗口大小合并到排名算法中。 对于给定的查询,最小的窗口wq,d被定义为文档d中标记的最小序列,以使查询q中的所有项都以该序列出现。


【文件预览】:
ranking_search_results-master
----2013.data()
--------queryDocTrainData(2.11MB)
--------queryDocTrainRel(200KB)
----ranked.txt(69KB)
----submit.py(9KB)
----data()
--------pa3.signal.dev(741KB)
--------pa3.signal.train(2.3MB)
--------pa3.rel.dev(76KB)
--------pa3.rel.train(234KB)
----build.xml(1KB)
----test.sh(189B)
----inverseDocFreqFile(8.21MB)
----ndcg.sh(113B)
----people.txt(15B)
----src()
--------edu()
----.project(368B)
----.classpath(226B)
----rank.sh(118B)
----.gitignore(5B)
----README.md(773B)
----report.pdf(162KB)
----newsubmit.py(10KB)
----cosineRankingFile(220KB)

网友评论