文件名称:改进性的文本聚类算法研究 (2009年)
文件大小:1.17MB
文件格式:PDF
更新时间:2024-06-14 14:53:04
自然科学 论文
在互联网技术日益发展的今天,如何快速对海量的文本进行归类是数据挖掘的一项重要课题。提出了一种改进型的文本聚类算法,计算句子相似度时综合考虑基于词频统计的特征向量表示法和关键词之间的关系,减少了相似度对于输入次序和频数的敏感度,有效地提高了计算小文档和简单句子相似度的准确度和文本聚类结果的准确率、召回率。
文件名称:改进性的文本聚类算法研究 (2009年)
文件大小:1.17MB
文件格式:PDF
更新时间:2024-06-14 14:53:04
自然科学 论文
在互联网技术日益发展的今天,如何快速对海量的文本进行归类是数据挖掘的一项重要课题。提出了一种改进型的文本聚类算法,计算句子相似度时综合考虑基于词频统计的特征向量表示法和关键词之间的关系,减少了相似度对于输入次序和频数的敏感度,有效地提高了计算小文档和简单句子相似度的准确度和文本聚类结果的准确率、召回率。