文件名称:论文研究-快速搜索与发现密度峰值聚类算法的优化研究.pdf
文件大小:1.57MB
文件格式:PDF
更新时间:2022-08-11 15:07:02
聚类,密度峰值,近邻距离曲线,类合并
CFSFDP是基于密度的新聚类算法,可聚类非球形数据集,具有聚类速度快、实现简单等优点。CFSFDP需人工尝试确定密度阈值dc,且对一个类中存在多密度峰值的数据无法进行准确聚类。为解决该缺点,提出基于近邻距离曲线和类合并优化CFSFDP(简称 NM-CFSFDP)的聚类算法。算法用近邻距离曲线变化情况自动确定密度阈值dc,采用确定dc的CFSFDP对数据聚类,并利用计算dc值的方法指导类的合并,引入内聚程度衡量参数解决了类合并后不能撤销的难题,从而实现对多密度峰值数据的正确聚类。通过实验对比,NM-CFSFDP算法确实比CFSFDP算法具有更加精确的聚类效果。