文件名称:使用机器学习和概念相关性的语义文本相似性-研究论文
文件大小:244KB
文件格式:PDF
更新时间:2024-06-30 03:38:13
Semantic Textual Similarity
当今世界有大量数据无法存储在物理设备中。 这些数据包含大量的冗余信息,这些信息可以组合在一起并进行分类。 我们提出了一个系统,它给出了两个语句之间的等价程度,即语义文本相似性 (STS)。 给定两个文本片段,系统的目标是确定它们的语义相似性,即它们在含义方面的相似程度。 我们的系统使用四种不同的文本相似性度量: 1. 单词 n-gram 重叠。 2.字符n-gram重叠。 3.语义重叠。 4. 概念重叠。 使用这些度量作为特征,它在 SemEval STS 数据上训练支持向量回归模型。 使用 Pearson 相关系数进行评估。