论文研究-基于语言网络和语义信息的文本相似度计算.pdf

时间:2022-09-26 21:16:29
【文件属性】:

文件名称:论文研究-基于语言网络和语义信息的文本相似度计算.pdf

文件大小:657KB

文件格式:PDF

更新时间:2022-09-26 21:16:29

论文研究

通过分析已有的基于统计和基于语义分析的文本相似性度量方法的不足,提出了一种新的基于语言网络和词项语义信息的文本相似度计算方法。对文本建立语言网络,计算网络节点综合特征值,选取TOP比例特征词表征文本,有效降低文本表示维度。计算TOP比例特征词间的相似度,以及这些词的综合特征值所占百分比以计算文本之间的相似度。利用提出的相似度计算方法在数据集上进行聚类实验,实验结果表明,提出的文本相似度计算方法,在F-度量值标准上优于传统的TF-IDF方法以及另一种基于词项语义信息的相似度量方法。


网友评论