文件名称:情感分析数据集(正面10000条,负面5000条)
文件大小:1.11MB
文件格式:RAR
更新时间:2020-08-06 14:14:10
数据集
吸收了 谭松波 非平衡酒店评论语料库(7000条正面,3000条负面,有部分重复数据),加上我从携程上抓取的数据,经过繁简转换、去重、去掉4字以下过短评论,形成最终的评论数据集(10000条正面,5000条负面,文本中每行为一个评论),欢迎下载使用!ps.数据正负面归类是按照携程上“值得推介”和“有待改善”栏目做初步区分,然后再经过人工筛选剔除归类错误的数据形成,因此难免会有错误,欢迎修正!358473546@qq.com
【文件预览】:
neg.txt
pos.txt