论文研究-引入信息熵的CURE聚类算法.pdf

时间:2022-08-11 15:23:18
【文件属性】:

文件名称:论文研究-引入信息熵的CURE聚类算法.pdf

文件大小:1.12MB

文件格式:PDF

更新时间:2022-08-11 15:23:18

层次聚类,CURE算法,信息熵,代表点选取

为了提高传统CURE(clustering using representatives)聚类算法的质量,引入信息熵对其进行改进。该算法使用K-means算法对样本数据集进行预聚类;采用基于信息熵的相似性度量,利用簇中元素提供的信息度量不同簇之间的相互关系,并描述数据的分布;在高、低层聚类阶段,采取不同的选取策略,分别选取相应的代表点。在UCI和人造数据集上的实验结果表明,提出的算法在一定程度上提高了聚类的准确率,且在大型数据集上比传统CURE算法有着更高的聚类效率。


网友评论