论文研究-文本分类中信息增益特征选择方法的研究.pdf

时间:2022-10-03 05:43:04
【文件属性】:

文件名称:论文研究-文本分类中信息增益特征选择方法的研究.pdf

文件大小:506KB

文件格式:PDF

更新时间:2022-10-03 05:43:04

论文研究

分析了传统信息增益(IG)特征选择方法忽略了特征项在类间、类内分布信息的缺点,引入类内分散度、类间集中度等因素,区分与类强相关的特征;针对传统信息增益(IG)特征选择方法没有很好组合正相关特征和负相关特征的问题,引入比例因子来平衡特征出现和不出现时的信息量,降低在不平衡语料集上负相关特征的比例,提高分类效果。通过实验证明了改进的信息增益特征选择方法的有效性和可行性。


网友评论