文本文档分类训练语料集

时间:2016-01-01 08:59:07
【文件属性】:

文件名称:文本文档分类训练语料集

文件大小:5.71MB

文件格式:TXT

更新时间:2016-01-01 08:59:07

自然语言处理 机器学习 语料 训练集

第一列是类别,每一行是一个文本。包括是个类,体育,艺术,计算机,军事等


网友评论

  • 挺好用的,目前做实验足够足够了
  • 资料库还是不错的,可以使用。
  • 很好,谢谢
  • 很有帮助,不错
  • 谢谢分享, 可以利用数据进行自己的小实验了
  • 首先,算是比较新,比较完备的数据了,而且,已经整理很好。正打算尝试下LDA模型~非常感谢!
  • 整理的很好~每行即为一段~类目数量也足够测试的~
  • 挺好用的,测试足够了
  • 资源很有帮助,十分感谢
  • 可以用来学习
  • 资料库挺好的,分词效果还不错
  • 内容挺多,适合做文本分类
  • 确实可用,但是对我没多大帮助
  • 每一行是一段文本以及分类标签
  • 不会用,可能是我自己水平还不到位吧
  • 不是很全,测试还行
  • 都是一大段的文字,能做简单测试
  • 不是我想要的,对于SVM训练知识不了解,不知道拿这个语料该怎么样
  • 用来做文本分类测试不错,适合做实验
  • 是真实可用的内容
  • 内容挺多,适合做文本分类
  • 其实就是复旦大学的中文语料库,感谢分享
  • 内容挺多,适合做试验~
  • 不是我要的,不过之后可能用得到,作文本分类,加油
  • 和我想象中的不一样
  • 还不错,训练集的内容还挺多
  • 适合做实验
  • 用来做文本分类测试不错,不过我更想要适合移动互联网内容体系的语料
  • 内容挺多,适合做试验~
  • 用它做了文本分类大作业,还可以!