文件名称:论文研究-一种融合词语位置特征的Lucene相似度评分算法.pdf
文件大小:460KB
文件格式:PDF
更新时间:2022-10-02 04:24:08
论文研究
相似度评分算法是Lucene引擎中的核心部分之一。对Lucene内部的相似度评分算法进行研究分析后,针对Lucene只关心查询词出现的频率,而不关心它们所在的位置这一缺陷提出了一种改进的算法。改进的算法将词语位置关系特征融合到Lucene原始相似度评分算法中。在TREC数据集上的实验结果表明:改进后的算法与Lucene原始算法相比,在MAP和P@n指标上都有一定程度的提高。