文件名称:通过 K 均值聚类测试未观察到的异质性-研究论文
文件大小:286KB
文件格式:PDF
更新时间:2024-06-30 03:23:21
model selection overfitting
k-means 等聚类方法已在各种应用中得到广泛应用。 本文提出了一个正式的测试程序,以确定是否可以拒绝单个集群的零假设,表明数据的同质性,以支持多个集群。 该检验实现简单,在相对温和的条件下有效(包括非正态性、数据在聚类分析以外的方面的异质性),适用范围广(包括时间序列维数小的聚类) ,或对均值以外的参数进行聚类)。 我们验证了该测试在有限样本中具有良好的规模控制,并说明了该测试在聚类汽车制造商和美国共同基金中的应用。