文件名称:论文研究-基于量化误差与分形理论的高计算效率无监督聚类研究.pdf
文件大小:1.91MB
文件格式:PDF
更新时间:2022-08-11 16:04:18
分形理论,量化误差,率失真曲线,无监督聚类,多维数据
已有的矢量聚类算法需学习较多的复杂数据方可获得较好的聚类效果,而对于多维的大数据性能较弱,为此提出一种基于量化误差与分形理论的高计算效率无监督聚类算法。首先,为数据集建立量化误差的参数化模型,基于数据集的空间结构获得数据集的率失真曲线;然后通过对率失真曲线的估算,获得数据空间的有效维度;最终利用分形理论,通过搜索数据集的量化模型参数获得目标数据集的最优类簇数量。实验结果表明,该量化误差参数化模型可较好地估算数据集的有效维度,同时,本算法对数值型数据集的最优类簇估算与计算效率优于已有的矢量聚类算法。