基于最近邻距离权重的ML-KNN算法

时间:2024-05-20 07:29:35
【文件属性】:

文件名称:基于最近邻距离权重的ML-KNN算法

文件大小:1.05MB

文件格式:PDF

更新时间:2024-05-20 07:29:35

多标签分类 ML-KNN 聚类

在大数据环境下,K近邻多标签算法(ML-KNN)高时间复杂度的问题显得尤为突出;此外,ML-KNN也没有考虑k个近邻对最终分类结果的影响。针对上述问题进行研究,首先将训练集进行聚类,再为测试集找到一个距离其最近的训练数据簇作为新的训练数据集;然后计算最近邻样本的距离权重,并用该权重描述最近邻和其他近邻对预测结果的影响;最后使用新的目标函数为待测样本分类。通过在图片、Web页面文本数据等数据集上的实验表明,所提算法得到了更好的分类结果,并且大大降低了时间复杂度。


网友评论