文件名称:云计算平台上的Canopy_Kmeans并行聚类算法研究_孙秀娟.pdf
文件大小:1.62MB
文件格式:PDF
更新时间:2022-12-11 04:07:35
云计算平台; Canopy-Kmeans算法 并行聚类算法; 大数据挖掘; 集群数据;
针对大数据的高维特性及海量性,提出云计算平台中的Canopy-Kmeans并行聚类算法,通过三角不等式原理,能够使计算冗余降低,使算法执行速度得到提高。对Canopy-Kmeans并行聚类算法进行深入的研究,并且在大量不同大小数据集中的实验结果表明,所设计的并行聚类算法具有良好的加速比、数据伸缩率及扩展率等特点,能够在海量数据挖掘及分析中使用。