【文件属性】:
文件名称:文本文档分类训练语料集
文件大小:5.71MB
文件格式:TXT
更新时间:2016-01-01 08:59:07
自然语言处理 机器学习 语料 训练集
第一列是类别,每一行是一个文本。包括是个类,体育,艺术,计算机,军事等
网友评论
- 挺好用的,目前做实验足够足够了
- 资料库还是不错的,可以使用。
- 很好,谢谢
- 很有帮助,不错
- 谢谢分享, 可以利用数据进行自己的小实验了
- 首先,算是比较新,比较完备的数据了,而且,已经整理很好。正打算尝试下LDA模型~非常感谢!
- 整理的很好~每行即为一段~类目数量也足够测试的~
- 挺好用的,测试足够了
- 资源很有帮助,十分感谢
- 可以用来学习
- 资料库挺好的,分词效果还不错
- 内容挺多,适合做文本分类
- 确实可用,但是对我没多大帮助
- 每一行是一段文本以及分类标签
- 不会用,可能是我自己水平还不到位吧
- 不是很全,测试还行
- 都是一大段的文字,能做简单测试
- 不是我想要的,对于SVM训练知识不了解,不知道拿这个语料该怎么样
- 用来做文本分类测试不错,适合做实验
- 是真实可用的内容
- 内容挺多,适合做文本分类
- 其实就是复旦大学的中文语料库,感谢分享
- 内容挺多,适合做试验~
- 不是我要的,不过之后可能用得到,作文本分类,加油
- 和我想象中的不一样
- 还不错,训练集的内容还挺多
- 适合做实验
- 用来做文本分类测试不错,不过我更想要适合移动互联网内容体系的语料
- 内容挺多,适合做试验~
- 用它做了文本分类大作业,还可以!