在之前,我们已经学过了四大类聚类分析及其典型算法。本文,我们将使用划分方法中的k-均值算法和层次聚类方法以一个实例进行完整的聚类分析演示。
1. 问题描述
例题: 为研究我国31个省、市、自治区2007年的城镇居民生活消费的规律,根据调查资料作区域消费类型划分。原始数据表1所示:
问题:
- 针对上述问题,采用k-means对其进行聚类(讨论k取何值才是最优);
- 采用层次聚类(讨论采用欧式距离,分别用最短距离法、最长距离法、类平均法、中间距离法、重心法和ward法得出的聚类图,哪个是最优的)。
实验结果
请阅读我的推文
程序参考
源程序及数据已经上传Github