论文研究-基于MapReduce的随机抽样K-means算法.pdf

时间:2022-09-30 07:12:21
【文件属性】:

文件名称:论文研究-基于MapReduce的随机抽样K-means算法.pdf

文件大小:630KB

文件格式:PDF

更新时间:2022-09-30 07:12:21

论文研究

K-means算法处理海量数据时,易产生系统内存溢出的现象。利用MapReduce框架改进K-means虽然解决了这个问题,但也存在着聚类效果不稳定以及准确率不高等问题,提出一种改进算法,利用MapReduce框架实现K-means时,采用多次随机抽样,通过计算密度、距离与平方误差等方法,最终选取较优的初始聚类中心,并在迭代中采用新的中心点计算方法。实验结果证明,改进后的算法具有较好的稳定性、准确性和加速比。


网友评论