中文情感分析 酒店评论预料

时间:2018-12-06 10:30:46
【文件属性】:

文件名称:中文情感分析 酒店评论预料

文件大小:3.81MB

文件格式:RAR

更新时间:2018-12-06 10:30:46

中文情感分析 酒店评论预料

为了弥补国内在中文情感挖掘方面的语料的匮乏,谭松波收集整理了一个较大规模的酒店评论语料。语料规模为10000篇。语料从携程网上自动采集,并经过整理而成。为了方便起见,语料被整理成4个子集: 1.ChnSentiCorp-Htl-ba-2000: 平衡语料,正负类各1000篇。 2.ChnSentiCorp-Htl-ba-4000: 平衡语料,正负类各2000篇。 3.ChnSentiCorp-Htl-ba-6000: 平衡语料,正负类各3000篇。 4.ChnSentiCorp-Htl-unba-10000: 非平衡语料,正类为7000篇。


【文件预览】:
中文情感挖掘酒店评论语料.rar
README-datatang.txt
url.txt

网友评论

  • 挺好的,数据也还行
  • 很好的资源,受用,谢谢!
  • 感谢分享。正好能用上
  • 还没用过,初略看了一下,感觉还可以
  • 主要是里面的文件格式不一样,不知道是不是故意的
  • 随便点开一个pos8,居然是个neg的,希望其他的不是
  • 处理的很好
  • 中文的语料库非常少, 感谢楼主
  • 感谢分享。正好能用上
  • 数据资源挺多的
  • 很多重复的句子,不过包含了很多家酒店的评论。
  • 就是我需要的东东
  • 还是比较全的
  • 整理得不错,可以做情感分析的语料,谢谢了~
  • 整理得很好,不过要自己再整理一下