论文研究-一种基于Hadoop的高效[K]-Medoids并行算法.pdf

时间:2022-10-01 21:41:29
【文件属性】:

文件名称:论文研究-一种基于Hadoop的高效[K]-Medoids并行算法.pdf

文件大小:645KB

文件格式:PDF

更新时间:2022-10-01 21:41:29

论文研究

针对传统[K]-Medoids算法对初始聚类中心敏感、收敛速度慢,以及在大数据环境下所面临的内存容量和CPU处理速度的瓶颈问题,从改进初始中心选择方案和中心替换策略入手,利用Hadoop分布式计算平台结合基于Top [K]的并行随机采样策略,实现了一种高效稳定的[K]-Medoids并行算法,并且通过调整Hadoop平台,实现算法的进一步优化。实验证明,改进的K-Medoids算法不仅有良好的加速比,其收敛性和聚类精度均得到了改善。


网友评论