文件名称:论文研究-基于稀疏指数排序的高维数据并行聚类算法.pdf
文件大小:496KB
文件格式:PDF
更新时间:2022-10-10 10:32:20
论文研究
论文研究-基于稀疏指数排序的高维数据并行聚类算法.pdf, 高维数据聚类是数据挖掘领域的重要研究课题,大规模高维数据聚类研究非常具有挑战性.针对高效的CABOSFV高维数据聚类算法,采用并行计算模式提高其大规模数据的处理能力,提出基于稀疏指数排序的高维数据并行聚类算法P_CABOSFV.该算法根据高维数据稀疏指数排序进行分割点选择实现数据划分,将数据分配到多个计算节点同时处理聚类任务,再基于集合稀疏特征差异度聚类结果合并策略将各计算节点的聚类结果合并得到最终聚类结果. UCI数据集和计算机合成数据集 实验表明:高维数据并行聚类算法P_CABOSFV聚类质量良好,具有很强的数据规模和数据维度可扩展性, 是有效可行的.