文件名称:文本分类语料库
文件大小:25.02MB
文件格式:GZ
更新时间:2019-11-15 10:02:31
分类语料库
Spark MLlib实现的中文文本分类–Naive Bayes。训练模型,语料非常重要,我这里使用的是搜狗提供的分类语料库,很早之前的了,这里只作为学习测试使用。
【文件预览】:
C000014.txt
C000013.txt
C000007.txt
C000023.txt
C000016.txt
C000020.txt
C000010.txt
C000022.txt
C000024.txt
C000008.txt