文件名称:deciding-the-number-of-clusterings.pdf
文件大小:1.46MB
文件格式:PDF
更新时间:2022-07-30 11:04:47
clustering
如何确定聚类的类别个数这个问题经常有人问我,也是一直以来让我 自己也比较困惑的问题。不过说到底其实也没什么困惑的,因为这个问 题本身就是一个比较 illposed 的问题呀:给一堆离散的点,要你给出它 们属于几个 cluster,这个基本上是没有唯一解或者说是没有合适的标准 来衡量的。比如如果简单地用每个类别里的点到类中心的距离之和来衡 量的话,一下子就会进入到 “所有的点都独立成一类” 这样的尴尬境界 中。