论文研究-基于主动数据选取的半监督聚类算法.pdf

时间:2022-08-11 13:43:34
【文件属性】:

文件名称:论文研究-基于主动数据选取的半监督聚类算法.pdf

文件大小:1.94MB

文件格式:PDF

更新时间:2022-08-11 13:43:34

数据挖掘, 半监督聚类, 主动学习, 标签数据, 数据选取,

利用少量标签数据获得较高聚类精度的半监督聚类技术是近年来数据挖掘和机器学习领域的研究热点。但是现有的半监督聚类算法在处理极少量标签数据和多密度不平衡数据集时的聚类精度比较低。基于主动学习技术研究标签数据选取, 提出了一个新的半监督聚类算法。该算法结合最小生成树聚类和主动学习思想, 选取包含信息较多的数据点作为标签数据, 使用类KNN思想对类标签进行传播。通过在UCI标准数据集和模拟数据集上的测试, 结果表明提出的算法比其他算法在处理多密度、不平衡数据集时有更高精度且稳定的聚类结果。


网友评论