文件名称:基于Hadoop架构的文本分类算法
文件大小:3.9MB
文件格式:RAR
更新时间:2017-07-13 09:12:06
Hadoop 文本分类 朴素贝叶斯 TF X2特征选择
基于Hadoop的文本分类算法系统,本系统实现了分词处理,停用词处理(IK);使用朴素贝叶斯分类算法来对文本进行训练和分类,在测试过程中使用词频特征选择作为特征词选择算法,分类准确率达到了78%,包含卡方特征选择算法(训练集特征选择)。
【文件预览】:
ext.dic
META-INF
----MANIFEST.MF(25B)
org
----wltea()
--------analyzer()