TransformersDataAugmentation:与“使用预训练的变压器模型进行数据扩充”相关的代码

时间:2024-05-21 19:16:30
【文件属性】:

文件名称:TransformersDataAugmentation:与“使用预训练的变压器模型进行数据扩充”相关的代码

文件大小:859KB

文件格式:ZIP

更新时间:2024-05-21 19:16:30

nlp text-classification transformers classification bart

使用预训练的变压器模型进行数据增强 该代码最初是从Amazon-research软件包( )发布的。在本文中,我们提到了网址,因此在此处提供相同代码的副本。 与相关的代码论文 代码包含以下数据扩充方法的实现 EDA(基准) 回译(基准) CBERT(基准) BERT Prepend(我们的论文) GPT-2前置(我们的论文) BART前置(我们的论文) 数据集 在本文中,我们使用以下资源中的三个数据集 STSA-2: : TREC: : SNIPS: : 低数据状态实验设置 运行src/utils/download_and_prepare_datasets.sh文件以准备所有数据集。 download_and_prepare_datasets.sh执行以下步骤 从github下载数据 用STSA-2和TREC数据集的文本替换数字标签 对于给定的数据集,创建Tra


【文件预览】:
TransformersDataAugmentation-main
----README.md(3KB)
----LICENSE(19KB)
----CONTRIBUTING.md(3KB)
----src()
--------utils()
--------bart_aug()
--------bert_aug()
--------scripts()
----CODE_OF_CONDUCT.md(309B)
----requirements.txt(43B)

网友评论