文件名称:NNC:核规范聚类-开源
文件大小:276KB
文件格式:ZIP
更新时间:2024-07-18 15:55:17
开源软件
我们提出了核范数聚类 (NNC),这是一种可用于不同领域的算法,作为 k 均值聚类方法的一种有前景的替代方法,并且对异常值不太敏感。 NNC 算法要求用户提供数据矩阵 M 和所需数量的集群 K。我们采用模拟退火技术来选择最小化 NN(L) 的最佳 L。 为了评估我们新开发的算法的优势,我们比较了 16 个公共数据集和 2 个真正的银屑病全基因组关联研究 (GWAS) 的性能,并将我们的方法与其他经典方法进行了比较。 结果表明,由于其更高的鲁棒性和准确性,我们的 NNC 方法始终优于其他方法。 总之,NNC 是一种有效的聚类方法,在大多数真实数据集中尤其优于 k-means。
【文件预览】:
public data
----parkinsons()
--------parkinsons_x.txt(34KB)
--------parkinsons_y.txt(390B)
----iris()
--------iris_y.txt(2KB)
--------iris_x.txt(2KB)
----blood_transfusion_service()
--------blood_transfusion_service_x.txt(9KB)
--------blood_transfusion_service_y.txt(1KB)
----wine()
--------wine_y.txt(356B)
--------wine_x.txt(10KB)
----Indian_liver_patient()
--------Indian_liver_patient_x.txt(19KB)
--------Indian_liver_patient_y.txt(1KB)
----chang_pathbased()
--------chang_pathbased_y.txt(600B)
--------chang_pathbased_x.txt(3KB)
----jain()
--------jain_x.txt(4KB)
--------jain_y.txt(746B)
----fu_flame()
--------fu_flame_x.txt(2KB)
--------fu_flame_y.txt(480B)
----Ionosphere()
--------Ionosphere_y.txt(702B)
--------Ionosphere_x.txt(73KB)
----QSAR()
--------QSAR_y.txt(2KB)
--------QSAR_x.txt(148KB)
----pima_Indians_diabetes()
--------pima_Indians_diabetes_y.txt(2KB)
--------pima_Indians_diabetes_x.txt(21KB)
----mammographic_mass()
--------mammographic_mass_x.txt(9KB)
--------mammographic_mass_y.txt(2KB)
----seeds()
--------seeds_y.txt(420B)
--------seeds_x.txt(9KB)
----Breast_Cancer_Wisconsin_Diagnost()
--------Breast_Cancer_Wisconsin_Diagnost_x.txt(132KB)
--------Breast_Cancer_Wisconsin_Diagnost_y.txt(2KB)
----spambase()
--------spambase_x.txt(673KB)
--------spambase_y.txt(9KB)