文件名称:直推式可信最邻近分类器在文本分类中的应用研究 (2008年)
文件大小:257KB
文件格式:PDF
更新时间:2024-06-13 07:50:09
自然科学 论文
直推式可信最邻近分类器是基于算法随机性理论提出的一种新的分类算法,它不仅能够判断样本的类别,还能够为每一个判断提供可信度,这对于分类机器的应用是很有意义的。但这种分类器需要将每一个待分类样本逐一在所有的类别中进行计算,使得计算量大大的增加。这一点对于多类别和大数据量的文本分类尤为明显。本文在深入研究该算法的基础上,对其利用聚类分析进行了改进,并将这一算法及其改进后的算法用在文本分类中。实验表明改进后的算法和原算法相比准确率相近,但在计算速度上提高了近40%。