《机器学习》——K-means聚类-k-means聚类流程

时间:2025-01-19 14:24:30
  • 1、初始化
    • 首先要确定聚类的数量 K。这个值通常是根据先验知识或者通过一些评估方法来确定的。例如,如果是对客户进行细分,可能根据业务经验确定大概分为几个不同的客户群体。
    • 随机选择 K 个数据点作为初始的聚类中心(centroid)。这些中心可以看作是每个簇的代表点。
  • 2、分配数据点到簇
    • 在这里插入图片描述
  • 3、更新聚类中心
    • 在这里插入图片描述
  • 4、重复步骤 2 和 3
    • 不断重复分配数据点和更新聚类中心的过程,直到聚类中心不再发生显著变化(例如,聚类中心的位置变化小于某个预先设定的阈值)或者达到最大的迭代次数。