论文研究-动态自适应特征权重的多类文本分类算法研究.pdf

时间:2022-08-11 17:21:16
【文件属性】:

文件名称:论文研究-动态自适应特征权重的多类文本分类算法研究.pdf

文件大小:234KB

文件格式:PDF

更新时间:2022-08-11 17:21:16

文本分类,特征权重,TF-IDF,分散度,梯度差

文本分类是研究文本数据挖掘、信息检索的重要手段,文本特征项权重值的计算是文本分类算法的关键。针对经典的特征权重计算方法TF-IDF中存在的不足,提出了一种动态自适应特征权重计算方法(DATW)。该算法不仅考虑了特征项在文本中出现的频率及该特征项所属文本在训练集中的数量,而且通过考查特征项的分散度和特征向量梯度差以自适应动态文本的分类。实验结果表明,采用DATW方法计算特征权重可以有效提高文本分类的性能。


网友评论