文件名称:PERL:论文的正式代码“ PERL
文件大小:52.19MB
文件格式:ZIP
更新时间:2024-06-07 10:26:40
Python
Perl -因为我们的TACL'20论文“基于枢轴领域适应性的预训练的深度嵌入语境化模型PERL”的官方代码 。 如果您使用此代码,请引用我们的论文。 PERL是用于文本分类的基于轴心的域适应模型。 该模型从大量经过预训练的上下文化词嵌入模型(例如BERT)中调整表示形式,以便它们缩小源域和目标域之间的差距。 这是通过使用基于掩码的语言建模(MLM)目标的基于轴的变体微调其参数来实现的,该变体针对来自源域和目标域的未标记数据进行了优化。 PERL建立在Python 3,pytorch和 。 它适用于CPU和GPU。 使用说明 使用PERL进行实验包含以下步骤(针对每对域): 选择枢轴特征。 共同使用信息标准和出现频率。 在经过预训练的基于BERT的案例中运行基于数据透视的微调。 我们对来自源域和目标域的未标记数据使用MLM目标的基于透视的变体。 使用微调的编码器,并在源域标记的
【文件预览】:
PERL-master
----run_full_experiment.sh(2KB)
----5-fold_data()
--------dvd()
--------electronics()
--------books()
--------airline()
--------kitchen()
----requirements.txt(525B)
----data()
--------dvd()
--------electronics()
--------books()
--------airline()
--------kitchen()
----modeling()
--------perl_for_finetune.py(15KB)
--------__pycache__()
--------classification_model.py(5KB)
----utils()
--------create_data_from_amazon_reviews.py(4KB)
--------pivot_selection.py(7KB)
--------__pycache__()
--------perl_embedding_initializer.py(896B)
--------logger.py(1KB)
----supervised_task_learning.py(41KB)
----README.md(7KB)
----perl_pretrain.py(34KB)
----run_classification.sh(2KB)
----run_perl_pretraining.sh(984B)