文件名称:论文研究-基于PCA和K均值聚类的有监督分裂层次聚类方法.pdf
文件大小:44KB
文件格式:PDF
更新时间:2022-08-11 16:11:32
数据挖掘,机器学习,有监督聚类,分裂层次聚类
提出了一种新的基于PCA和K均值聚类的有监督二叉分裂层次聚类方法PCASHC,用K均值聚类进行逐次二叉聚簇分裂,选择PCA第一主成分相距最远样本点作为K均值聚类初始聚簇中心,解决了K均值聚类初始中心随机选择导致结果不确定的问题,用聚簇样本类别方差作为聚簇样本不纯度控制聚簇分裂水平,避免过拟合,可学习到合适的聚类数目。用四组UCI标准数据集对其进行了10折交叉验证分类误差检验,与另外七种分类器相比说明PCASHC有较高的分类精度。