文件名称:基于离群点检测的K- means算法 (2014年)
文件大小:789KB
文件格式:PDF
更新时间:2024-05-18 09:01:45
自然科学 论文
K- means算法以其简单、快速的特点在现实生活中得到广泛应用.然而传统K- means算法容易受到噪声的影响,导致聚类结果不稳定,聚类精度不高.针对这个问题,提出一种基于离群点检测的K- means算法,首先检测出数据集中的离群点,在选择初始种子的时候,避免选择离群点作为初始种子.然后在对非离群点进行聚类完成后,根据离群点到各个聚类的距离,将离群点划分到相应的聚类中.算法有效降低离群点对K- means算法的影响,提高聚类结果的准确率.实验表明,在聚类类别数给定的前提下,在标准数据集UCI上该算法有效