基于CHI值特征选取和覆盖的文本分类方法

时间:2014-05-26 10:18:19
【文件属性】:

文件名称:基于CHI值特征选取和覆盖的文本分类方法

文件大小:159KB

文件格式:PDF

更新时间:2014-05-26 10:18:19

CHI 特征选取 文本分类

利用 CHI 值特征选取和前向神经网络的覆盖算法, 通过对文本进行分词的预处理后, 实现文本的自动分类。该方法利用CHI 值进行特征选取即特征降维,应用覆盖算法进行文本分类。该方法将 CHI 值特征选取和覆盖算法充分结合,在提高了分类速度的同时还保证了分类的准确度。应用该方法对标准数据集中的文本进行实验, 并在不同的维数上与SVM 算法、 朴素贝叶斯方法的实验结果进行了比较。结果表明,与SVM 算法和朴素贝叶斯方法相比较, 覆盖算法在准确度上更好。并且,维数的选择对分类的精确度影响很大。


网友评论

  • 论文很详细,但是重点不是很突出