文件名称:情感发现:用于大规模情感分类的无监督语言建模
文件大小:54.16MB
文件格式:ZIP
更新时间:2024-03-19 00:12:06
Python
**已弃用** 此仓库已被弃用。 请访问以获取我们最新的大规模无监督预训练和微调代码。 如果您仍想使用此代码库,请参阅带有标签的发行版,并安装必需的软件/相关性,这些软件/相关性在该日期公开发布。 PyTorch无监督情绪发现 该代码库包含预训练的二进制情感和多模型情感分类模型,以及用于重现我们一系列大规模预训练+传输NLP论文的结果的代码:并。 这项工作源于对OpenAI的“论文进行复制,分析和缩放的愿望。 该存储库中使用的技术是通用的,我们易于使用的命令行界面可用于在您自己的困难分类数据集上训练最新的分类模型。 该代码库支持混合精度训练以及语言模型的分布式,多GPU,多节点训练(基于NVIDIA 项目提供了支持)。 除了训练语言模型之外,此代码库还可用于在自定义文本分类数据集上轻松转移和优化训练后的模型。 例如,在PyTorch中实现了语言模型,该模型用于对大型文本数据集(例
【文件预览】:
sentiment-discovery-master
----multiproc.py(1KB)
----figures()
--------heat_gen_negate_overwrite.png(35KB)
--------sentiment_performance.png(37KB)
--------both_scalability.png(64KB)
--------heat_review.png(15KB)
--------reproduction_graph.png(62KB)
--------distributed_scalability.png(38KB)
--------highlighted_neuron.png(48KB)
--------extremes.png(71KB)
--------fused_figure.png(110KB)
--------loss.png(27KB)
--------16vs32.png(20KB)
--------heat_gen.png(25KB)
--------negative_neuron.png(29KB)
--------paper_vals.png(48KB)
--------errors.png(35KB)
--------amazon_train_time.png(64KB)
--------.gitkeep(0B)
--------final_vals.png(48KB)
--------highlighted_final_vals.png(159KB)
--------plutchik-wheel.png(135KB)
--------semeval_leaderboard.png(50KB)
--------heat_gen_overwrite.png(38KB)
--------semeval_results.PNG(38KB)
--------size_comparison.png(26KB)
----experiments()
--------run_sk_sst.sh(68B)
--------run_sk_imdb.sh(163B)
--------train_transformer_singlenode.sh(535B)
--------run_clf_sst.py(2KB)
--------run_se_multihead.sh(185B)
--------train_mlstm_singlenode.sh(334B)
--------run_sst.sh(47B)
--------run_clf_binary.py(3KB)
--------run_clf_single_head.py(3KB)
--------run_se_singlehead.sh(187B)
--------run_clf_multihead.py(3KB)
----finetune_classifier.py(33KB)
----run_classifier.py(9KB)
----arguments.py(21KB)
----script_docs()
--------arguments.md(26KB)
----generate.py(9KB)
----fp16()
--------loss_scaler.py(5KB)
--------fp16util.py(6KB)
--------__init__.py(47B)
--------fp16.py(27KB)
----model()
--------distributed.py(4KB)
--------RNN_utils()
--------sentiment_classifier.py(15KB)
--------checkpoint.py(7KB)
--------model.py(13KB)
--------__init__.py(143B)
--------transformer_utils.py(16KB)
--------transformer.py(14KB)
----main.py(18KB)
----pretrain.py(16KB)
----configure_data.py(8KB)
----learning_rates.py(8KB)
----analysis()
--------unsupervised.md(6KB)
--------reproduction.md(11KB)
--------questions.md(2KB)
--------scale.md(2KB)
----logreg_utils.py(7KB)
----LICENSE(3KB)
----setup.py(839B)
----README.md(19KB)
----threshold.py(10KB)
----transfer.py(16KB)
----reparameterization()
--------weight_norm.py(3KB)
--------reparameterization.py(6KB)
--------__init__.py(6KB)
----metric_utils.py(3KB)
----data()
--------amazon()
--------imdb()
--------binary_sst()
--------semeval()
----.gitignore(1KB)
----data_utils()
--------samplers.py(13KB)
--------tokenization.py(11KB)
--------datasets.py(19KB)
--------__init__.py(3KB)
--------loaders.py(13KB)
--------lazy_loader.py(5KB)
--------cache.py(2KB)
--------preprocess.py(9KB)