文件名称:valclust:聚类验证和分析
文件大小:137KB
文件格式:ZIP
更新时间:2024-06-11 14:21:55
Python
洋蓟 聚类验证和分析 不同类型的集群有效性指标: 外部指标:将聚类结果与先验已知聚类进行比较 内部指标:在不与任何其他集群解决方案进行比较的情况下测量集群的质量 相对不确定度:比较从不同算法或不相似度量获得的聚类结果 外部指标: 纯度 NMI(标准化互信息-信息理论) NID MCC(马修相关系数) 内部指标: 轮廓指数 戴维斯-布尔丁指数 卡林斯基-哈拉巴斯指数 邓恩指数 RMSSTD指数 差距统计(查找集群数) 不同分组之间的相似性度量 余弦相似度或相关性 匹配系数 雅卡德系数 clusterSeparation 属于内部债务类别 群集的可分离性和紧凑性 通过计算集群内和集群间距离来测量集群的质量。 示例:内部有效性 import numpy as np from valclust.InternalValidity import PairwiseDistanceSamp
【文件预览】:
valclust-master
----MANIFEST.in(45B)
----MANIFEST(351B)
----.RData(45KB)
----.Rhistory(351B)
----valclust()
--------ExternalValidity()
--------InternalValidity()
--------cluster.py(3KB)
--------stability()
--------__init__.py(151B)
--------external.py(3KB)
----tests()
--------test_internal.py(1KB)
--------test_external.py(2KB)
--------example.py(676B)
--------example.dat(57KB)
--------test_cluster.py(1KB)
----LICENSE(34KB)
----README(54B)
----requirements.txt(15B)
----doc()
--------dbscan.py(3KB)
--------data.3clusters.dat(150KB)
----setup.py(1KB)
----.gitignore(706B)
----README.md(2KB)