文本分类算法的比较研究

时间:2013-06-21 01:31:51
【文件属性】:

文件名称:文本分类算法的比较研究

文件大小:457KB

文件格式:PDF

更新时间:2013-06-21 01:31:51

文本分类 算法 Bayes KNN SVM

本文通过对Bayes、KNN、SVM应用于中文文本分类进行比较实验研究。应用ICTCLAS对中文文档进行分词,在大维数,多数据情况下应用TFIDF进行特征选择,并同时利用它实现了对特征项进行加权处理,使文本库中的每个文本具有统一的、可处理的结构模型。然后通过三类分类算法实现了对权值数据进行训练和分类。


网友评论

  • 讲的比较浅,适合入门的人看
  • 很不错的文章,对我之前的论文有帮助!
  • 对预处理,和三种分类算法做了详尽的介绍,很不错的文章。
  • 不错,对几个文本分类比较对实验有帮助
  • 有一本书上有一章是讲这个算法的。《集体智慧编程》
  • 看样子是一个本科论文,感谢分享