sentiment140情感分类数据集

时间:2022-08-23 12:41:46
【文件属性】:

文件名称:sentiment140情感分类数据集

文件大小:86.3MB

文件格式:ZIP

更新时间:2022-08-23 12:41:46

文本分类 自然语言处理 NLP 情感分类 Sentiment140

该数据集包含了1,600,000条从推特爬取的推文,可用于情感分析相关的训练。 该数据集包含两个数据文件:测试集(test)和训练集(training) 数据文件没有包含heading,从左到右分别是: (1)推文标注(polarity): 0 = 负面,2 = 中立,4 = 正面 (2)推文的id (3)时间:Sat May 16 23:58:44 UTC 2009 (4)Query (lyx),如果没有query,数值为NO_QUERY. (5)发推的用户:robotickilldozr (6)推文内容


【文件预览】:
testdata.manual.2009.06.14.csv
training.1600000.processed.noemoticon.csv

网友评论