文件名称:基于K中心点的文档聚类算法 (2005年)
文件大小:2.69MB
文件格式:PDF
更新时间:2024-06-14 12:09:52
自然科学 论文
K中心点算法是一个常用的聚类算法,它的主要缺陷是容易陷入局部极值,计算代价太高。本文先构造一个运用余弦相似度的K中心点文档聚类算法,然后提出一个改进算法,该算法不增加计算的复杂性,显著改进文档的聚类结果。最后,将该改进算法作为局部搜索过程嵌入到迭代局部搜索结构中,构造一个基于K中心点的迭代局部搜索文档聚类算法,进一步改进了文档聚类结果。试验结果表明该算法显著改进了文档聚类结果。