论文研究-基于数据集压缩的聚类算法性能优化研究.pdf

时间:2022-08-11 13:06:48
【文件属性】:

文件名称:论文研究-基于数据集压缩的聚类算法性能优化研究.pdf

文件大小:1.05MB

文件格式:PDF

更新时间:2022-08-11 13:06:48

聚类,数据压缩,聚类性能

针对目前聚类算法对大数据集的聚类分析中存在时间花费过大的问题,提出了一种基于最近邻相似性的数据集压缩算法。通过将若干个相似性最近邻的数据点划分成一个数据簇并随机选择簇头构成新的数据集,大大缩减了数据的规模。然后分别采用K-means算法和AP算法对压缩后的数据集进行聚类分析。实验结果表明,压缩后的数据集与原始数据集的聚类分析相比,在保证聚类准确率基本一致的前提下,有效降低了聚类的花费时长,提高了算法的聚类性能,证明了该数据集压缩算法在聚类分析中的有效性和可靠性。


网友评论