IMDB影评文本-神经网络文本分类数据集

时间:2022-05-06 04:39:35
【文件属性】:

文件名称:IMDB影评文本-神经网络文本分类数据集

文件大小:80.71MB

文件格式:ZIP

更新时间:2022-05-06 04:39:35

IMDB影评 神经网络 文本分类 情感计算

aclIMDB_v1:大型电影评论数据集(来自斯坦福大学),其中包含50,000个电影评论(50%为负,50%为正)。该集合被划分为训练和验证数据集(每个数据集有25000个电影评论,具有相同数量的正面和负面评论),还包括了5000条未标注的影评。其中有已处理好的单词包 rt-polaritydata:也是IDMB整理的数据集,较上一个数据集小,且已经大致地处理过了,标点符号分隔开,全部小写化。包含10,662个电影评论(半正,半负)。此文件中的每一行都是一则短短的电影评论。


【文件预览】:
IMDB
----rt-polaritydata.tar.gz(476KB)
----aclImdb_v1.tar.gz(80.23MB)

网友评论

  • 不错的数据集,分数略贵