文件名称:论文研究-基于词频分布信息的优化IG特征选择方法.pdf
文件大小:500KB
文件格式:PDF
更新时间:2022-09-27 07:44:56
论文研究
文本特征选择是文本分类的核心技术。针对信息增益模型的不足之处,以特征项的频数在文本中不同层面的分布为依据,分别从特征项基于文本的类内分布、基于词频的类内分布以及词频的类间分布等角度对IG模型逐步进行改进,提出了一种基于词频分布信息的优化IG特征选择方法。随后的文本分类实验验证了提出的优化IG模型的有效性。
文件名称:论文研究-基于词频分布信息的优化IG特征选择方法.pdf
文件大小:500KB
文件格式:PDF
更新时间:2022-09-27 07:44:56
论文研究
文本特征选择是文本分类的核心技术。针对信息增益模型的不足之处,以特征项的频数在文本中不同层面的分布为依据,分别从特征项基于文本的类内分布、基于词频的类内分布以及词频的类间分布等角度对IG模型逐步进行改进,提出了一种基于词频分布信息的优化IG特征选择方法。随后的文本分类实验验证了提出的优化IG模型的有效性。