文件名称:ChnSentiCorp中文情感分析 酒店评论语料
文件大小:6.28MB
文件格式:ZIP
更新时间:2022-05-01 09:15:43
中文情感分析 ChnSen
说明:谭松波收集整理了一个较大规模的酒店评论语料。语料规模为10000篇。语料从携程网上自动采集,并经过整理而成。为了方便起见,语料被整理成4个子集: 1. ChnSentiCorp-Htl-ba-2000: 平衡语料,正负类各1000篇。 2. ChnSentiCorp-Htl-ba-4000: 平衡语料,正负类各2000篇。 3. ChnSentiCorp-Htl-ba-6000: 平衡语料,正负类各3000篇。 4. ChnSentiCorp-Htl-unba-10000: 非平衡语料,正类为7000篇。
【文件预览】:
谭松波-酒店评论-语料-1w条-utf-8
----10000.rar(3.4MB)
----2000.rar(718KB)
----.DS_Store(6KB)
----汇总.rar(1023KB)
----4000.rar(1.4MB)
----6000.rar(2.1MB)