文件名称:python-hartigan:在 Python 中确定“正确”K-Means 数量的无监督方法
文件大小:2KB
文件格式:ZIP
更新时间:2024-07-07 12:40:15
Python
PYTHON-HARTIGAN 是一个 Python 脚本,它提供了一种无监督的方法来确定 K-Means 聚类中的最佳值 K。 该脚本是 Hartigan 规则的一个实现——本质上,它测量了随着集群数量的增加拟合优度的变化。 此实现基于 Chiang & Mirkin (2009), §3.1(B)。 随意以任何方式更改脚本; 它被注释以指导您可能需要进行的任何编辑。 如果你想建立你对 Hartigan 规则的直觉,我建议将 'threshold' 参数设置为 0 或一个小的正值,并在 while 循环中包括一行,在每次迭代后打印 'H_Rule'。 我还强烈建议您阅读 Chiang & Mirkin 的文章,其中指出了其他无监督方法在某些情况下表现更好的情况。 PYTHON-HARTIGAN 依赖于两个标准的 Python 科学包:numpy 和 scikit-learn。 R
【文件预览】:
python-hartigan-master
----README.md(1KB)
----hartigan.py(1KB)