文件名称:理解聚类分析-tinyxml指南[中文]
文件大小:6.46MB
文件格式:PDF
更新时间:2024-07-04 16:39:26
RapidMiner
9.1 理解聚类分析 餐饮企业经常会碰到这样的问题: 1) 如何通过餐饮客户消费行为的测量,进一步评判餐饮客户的价值和对餐饮客户进 行细分,找到有价值的客户群和需关注的客户群? 2) 如何合理对菜品进行分析,以便区分哪些菜品畅销毛利又高,哪些菜品滞销毛利 又低? 餐饮企业遇到的这些问题,可以通过聚类分析解决。 9.1.1 常用聚类分析算法 与分类不同,聚类分析是在没有给定划分类别的情况下,根据数据相似度进行样本分组 的一种方法。与分类模型需要使用有类标记样本构成的训练数据不同,聚类模型可以建立在 无类标记的数据上,是一种非监督的学习算法。聚类的输入是一组未被标记的样本,聚类根 据数据自身的距离或相似度将他们划分为若干组,划分的原则是组内样本最小化而组间(外 部)距离最大化,如图 9-1 所示。 图 9-1 聚类分析建模原理 常用聚类方法见表 9-1。 表 9-1 常用聚类方法 类别 包括的主要算法