聚类算法——KMEANS算法

时间:2022-02-10 03:51:31

聚类概念

  无监督问题:我们手里没有标签

  聚类:相似的东西分到一组

  难点:如何评估,如何调参

    聚类算法——KMEANS算法

基本概念

  要得到簇的个数,需要指定K值

  质心:均值,即向量各维取平均即可

  距离的度量:常用欧几里得距离和余弦度(先标准化)

  优化目标:

        聚类算法——KMEANS算法

  工作流程:

        聚类算法——KMEANS算法

  优势:

    简单、快速、适合常规数据集

  劣势:

    K值难确定

    复杂度与样本呈线性关系

    很难发现任意形状的簇

      聚类算法——KMEANS算法