文件名称:python实现kMeans算法
文件大小:52KB
文件格式:PDF
更新时间:2024-02-09 22:57:49
kmeans ns python
聚类是一种无监督的学习,将相似的对象放到同一簇中,有点像是全自动分类,簇内的对象越相似,簇间的对象差别越大,则聚类效果越好。 1、k均值聚类算法 k均值聚类将数据分为k个簇,每个簇通过其质心,即簇中所有点的中心来描述。首先随机确定k个初始点作为质心,然后将数据集分配到距离最近的簇中。然后将每个簇的质心更新为所有数据集的平均值。然后再进行第二次划分数据集,直到聚类结果不再变化为止。 伪代码为 随机创建k个簇质心 当任意一个点的簇分配发生改变时: 对数据集中的每个数据点: 对每个质心: 计算数据集到质心的距离 将数据集分配到最