基于K-means的算法研究

时间:2013-06-06 03:31:11
【文件属性】:

文件名称:基于K-means的算法研究

文件大小:2.83MB

文件格式:PDF

更新时间:2013-06-06 03:31:11

K-means

本数据高维性和稀疏性的特点使得文本对象间的相似度不易度量,根据文本 间的相似度为k-means算法选择的始聚类中心时可能不能很好的代表整个文本集。针对 该缺点,对k.means算法中的初始化问题,提出一个改进的初始聚类中心选择方法。实 验表明改进的方法选择到初始聚类中心比较分散且代表性好。


网友评论