Kmeans算法肘部法则--Kmeans算法确定K值

时间:2024-03-14 15:37:57

肘部法则对于K-means算法的K值确定起到指导作用,很多人在用K-means算法的时候可能不知道如何确定K取多少比较好,在面试也会遇到K值确定的问题。肘部算法可以有效解决这个问题

简单叙述一下肘部法则,由左下图,y轴为SSE(Sum of the Squared Errors-误差平方和),x轴为k的取值,随着x的增加,SSE会随之降低,当下降幅度明显趋向于缓慢的时候,取该值为K的值。
Kmeans算法肘部法则--Kmeans算法确定K值
1 )对于n个点的数据集,迭代计算k from 1 to n,每次聚类完成后计算每个点到其所属 的簇中心的距离的平方和;
2)平方和是会逐渐变小的,直到k 时平方和为0,因为每个点都是它所在的簇中心本身。
3)在这个平方和变化过程中,会出现一个拐点也即“肘”点,下降率突然变缓时即认为 是佳的k值。
在决定什么时候停止训练时,肘形判据同样有效,数据通常有更多的噪音,在增加分类 无法带来更多回报时,停止增加类别。