文件名称:capsule_text_classification
文件大小:2.88MB
文件格式:ZIP
更新时间:2024-06-05 23:23:29
Python
capsule_text_classification 要求:代码是用Python(2.7)编写的,并且需要Tensorflow(1.4.1)。 数据文件夹包括电影评论器(MR),斯坦福情感树库(SST)。 主题,TREC问题,客户评论(CR),AG新闻语料库。 请注意,NLTK.reuters程序包中包含了Reuters-21578数据集,该数据包来自 。 preprocess.py提供了清理原始数据并为每个数据集生成元数据的功能,例如单词词汇及其嵌入表示形式,这些元素由来自的经过预训练的word2vec向量初始化,路透社语料库除外。 reuters_process.py提供了清除原始数据并生成Reuters-Multilabel和Reuters-Full数据集的功能。 utils.py包含一些包装的基本功能,例如_conv2d_wrapper,_separable_conv2
【文件预览】:
capsule_text_classification-master
----loss.py(1KB)
----main.py(9KB)
----utils.py(4KB)
----data(1B)
----reuters_process.py(6KB)
----preprocess.py(7KB)
----data1()
--------agnews.test.all(1.73MB)
--------stsa.binary.train(722KB)
--------rt-polarity.all(1.2MB)
--------TREC.train.all(286KB)
--------stsa.binary.phrases.train(4.05MB)
--------custrev.all(365KB)
--------stsa.binary.test(189KB)
--------a.txt(5B)
--------stsa.binary.dev(92KB)
--------subj.all(1.26MB)
--------TREC.test.all(19KB)
----layers.py(11KB)
----README.md(2KB)
----network.py(3KB)