文件名称:基于云计算平台Hadoop的并行k_means聚类算法设计研究_赵卫中.pdf
文件大小:348KB
文件格式:PDF
更新时间:2022-12-11 04:13:48
云计算; Hadoop平台; 并行k-means; MapReduce;
随着数据库技术的发展和Internet的迅速普及,实际应用中需要处理的数据量急剧地增长,致聚类研究面临许多新的问题和挑战,如海量数据和新的计算环境等。深入研究了基于云计算平台Hadoop的并行k-means聚类算法,给出了算法设计的方法和策略。在多个不同大小数据集上的实验表明,设计的并行聚类算法具有优良的加速比、扩展率和数据伸缩率等性能,适合用于海量数据的分析和挖掘。