文件名称:论文研究-基于权重差异和类别关联的互信息改进研究.pdf
文件大小:748KB
文件格式:PDF
更新时间:2022-08-11 15:00:28
特征选择,互信息,权重差异,类别关联
作为文本分类中常用的特征选择方法,互信息在进行特征权重计算时,未考虑特征的正、负相关性及其影响程度的不同,同时也忽略了特征在类别中的分布情况。针对以上不足,通过分别引入权重差异因子和类别关联因子进行互信息模型的改进研究,优化特征词的权重区分度,加强特征与类别的联系。实验结果表明,改进后的互信息特征选择方法优化了特征权重的计算,显著提高了分类效果,从而证明了改进的互信息特征选择方法的有效性。