文件名称:异构数据集挖掘框架-研究论文
文件大小:696KB
文件格式:PDF
更新时间:2024-06-08 10:39:54
Distance Measure Hybrid Clustering Heterogeneous
许多人已经探索了各种聚类策略来划分具有数值,二进制,名义和序数属性的异构数据集。 聚类算法试图根据对象的属性值识别相似的对象组。 这些算法假定属性为同类类型,或转换为同类类型。 在现实世界中,数据集通常具有异构性质。 如果这些数据被转换,则会导致信息丢失。 本文提出了一种具有统一相似性度量的混合方法,以对异构性质的聚类数据集进行聚类。 提出的混合聚类算法可以在不改变特征的情况下,识别具有异构数据类型的相似对象集。 实验结果表明,提出的聚类算法产生了更好的结果。