文件名称:学习特征权值对聚类算法的优化 (2008年)
文件大小:192KB
文件格式:PDF
更新时间:2024-06-21 01:44:51
自然科学 论文
现有的k- 均值聚类算法大都是以距离差异为基础的,而同等重要地依赖所有属性的相似性度量会引起误导.传统的k - 均值算法选择的相似性度量通常是欧几里德距离的倒数,这种距离通常涉及所有的特征.而在距离公式中引入一些特征权值后,其聚类结果将依赖于这些权值, 从而可以通过调整这些权值优化聚类效果.由于k - 均值算法是迭代算法,很难直接确定其权值以优化聚类结果,因此提出了一种通过免疫算法学习权值的方法以改进聚类结果.实验结果显示,该方法确定的权重值在提高聚类效果方面是可行的、有效的.