文件名称:文本分类中特征选择方法的比较与改进 (2011年)
文件大小:445KB
文件格式:PDF
更新时间:2024-06-06 14:24:24
自然科学 论文
为了在面向旅游领域的文本分类系统中选择有效的分类特征,提高分类性能,本文根据系统采用的训练集、训练过程及分类算法等因素重新对各常用的特征选择方法进行了综合实验评测,比较了五种常用的特征选择方法,对于评测结果最好的三种函数:期望交叉熵、信息增益和互信息,通过理论分析和科学实验,分别提出了不同的改进方法。实验结果表明改进的期望交叉熵方法在本应用中能够最有效地提高系统的分类性能。