文件名称:论文研究-文本分类中改进型CHI特征选择方法的研究.pdf
文件大小:454KB
文件格式:PDF
更新时间:2022-09-28 06:51:45
论文研究
分析了影响传统CHI统计方法分类精度的因素,去除了特征项与类别负相关的情况。同时将改进后的方法用于特征词的权重调整,使其分类效果有了明显提高;将分散度、集中度、频度等因素引入到改进后的方法中,提高了其在类分布不均匀语料集上的分类精确度。最后通过实验证明了该方法的有效性和可行性。
文件名称:论文研究-文本分类中改进型CHI特征选择方法的研究.pdf
文件大小:454KB
文件格式:PDF
更新时间:2022-09-28 06:51:45
论文研究
分析了影响传统CHI统计方法分类精度的因素,去除了特征项与类别负相关的情况。同时将改进后的方法用于特征词的权重调整,使其分类效果有了明显提高;将分散度、集中度、频度等因素引入到改进后的方法中,提高了其在类分布不均匀语料集上的分类精确度。最后通过实验证明了该方法的有效性和可行性。