文件名称:20ng_mr_ohsumed_R8_R52_agnews_imdb等13个数据集
文件大小:49.87MB
文件格式:7Z
更新时间:2024-02-10 06:38:25
数据集 文本分类
13个文本分类数据集,按train,test集顺序存储
【文件预览】:
corpus
----ag_news.labels.txt(374KB)
----R8.labels.txt(46KB)
----R8.texts.txt(4.3MB)
----ohsumed.texts.txt(8.94MB)
----WebKB.labels.txt(36KB)
----ag_news.texts.txt(28.96MB)
----R52.labels.txt(57KB)
----TREC.texts.txt(331KB)
----20ng.labels.txt(324KB)
----20ng.texts.txt(32.8MB)
----aclImdb.texts.txt(62.55MB)
----dblp.labels.txt(239KB)
----mr.texts.txt(1.18MB)
----aclImdb.labels.txt(244KB)
----TREC.labels.txt(32KB)
----SST2.texts.txt(993KB)
----ohsumed.labels.txt(36KB)
----SST2.labels.txt(28KB)
----dblp.texts.txt(4.95MB)
----wiki.labels.txt(1021KB)
----SST1.labels.txt(35KB)
----mr.labels.txt(31KB)
----SST1.texts.txt(1.18MB)
----wiki.texts.txt(65.46MB)
----R52.texts.txt(5.49MB)
----WebKB.texts.txt(3.65MB)