文件名称:论文研究-基于方差的CHI特征选择方法.pdf
文件大小:1.14MB
文件格式:PDF
更新时间:2022-08-11 16:51:09
文本分类,特征选择,卡方统计量,方差
通过分析特征词与类别间的相关性,在原有的卡方特征选择的方法上增加三个调节参数,使选出的特征词集中分布在某一类,且在某一类中尽可能地均匀分布,并使特征词在某一类中出现的次数尽可能地多。通过实验对比改进前后的卡方特征选择方法,基于方差的卡方统计(Var-CHI)方法使得查全率和查准率都得到了明显的提高。
文件名称:论文研究-基于方差的CHI特征选择方法.pdf
文件大小:1.14MB
文件格式:PDF
更新时间:2022-08-11 16:51:09
文本分类,特征选择,卡方统计量,方差
通过分析特征词与类别间的相关性,在原有的卡方特征选择的方法上增加三个调节参数,使选出的特征词集中分布在某一类,且在某一类中尽可能地均匀分布,并使特征词在某一类中出现的次数尽可能地多。通过实验对比改进前后的卡方特征选择方法,基于方差的卡方统计(Var-CHI)方法使得查全率和查准率都得到了明显的提高。