论文研究-基于词频分布信息的优化IG特征选择方法.pdf

时间:2022-09-27 07:44:56
【文件属性】:

文件名称:论文研究-基于词频分布信息的优化IG特征选择方法.pdf

文件大小:500KB

文件格式:PDF

更新时间:2022-09-27 07:44:56

论文研究

文本特征选择是文本分类的核心技术。针对信息增益模型的不足之处,以特征项的频数在文本中不同层面的分布为依据,分别从特征项基于文本的类内分布、基于词频的类内分布以及词频的类间分布等角度对IG模型逐步进行改进,提出了一种基于词频分布信息的优化IG特征选择方法。随后的文本分类实验验证了提出的优化IG模型的有效性。


网友评论