基于Hadoop架构的文本分类算法

时间:2017-07-13 09:12:06
【文件属性】:

文件名称:基于Hadoop架构的文本分类算法

文件大小:3.9MB

文件格式:RAR

更新时间:2017-07-13 09:12:06

Hadoop 文本分类 朴素贝叶斯 TF X2特征选择

基于Hadoop的文本分类算法系统,本系统实现了分词处理,停用词处理(IK);使用朴素贝叶斯分类算法来对文本进行训练和分类,在测试过程中使用词频特征选择作为特征词选择算法,分类准确率达到了78%,包含卡方特征选择算法(训练集特征选择)。


【文件预览】:
ext.dic
META-INF
----MANIFEST.MF(25B)
org
----wltea()
--------analyzer()

网友评论

  • CSDN的60秒限制实在是醉了。。。 算法不错,值得学习。
  • 还不错的资源,先学习再说
  • 可能好用吧,但发现不是我需要的,不过还是不错
  • 程序好像无法运行,提供一个搭配环境的文档会更好点
  • 程序不全,连main都没有,无法运行