文件名称:dab
文件大小:7.47MB
文件格式:ZIP
更新时间:2024-04-04 06:42:42
JupyterNotebook
这是从vietai / dab(当前为私人回购)中复制的 :sparkles: 通过反向翻译(DAB)进行数据增强 :sparkles: 该存储库基于反向翻译[1]作为数据增强方法[2,3]的思想。 这个想法很简单:将一种语言的句子翻译成另一种语言,然后再翻译回原来的语言。 这样一来,任何NLP数据集的大小都可以相乘。 使用我们的代码的示例如下所示: 在此项目中,我们为人们提供了一个不错的界面,使人们可以交互地研究与任何tensor2tensor检查点一起使用的反翻译模型。 我们还提供了以批处理模式执行反向翻译的选项,以反向翻译完整的数据集,请参阅。 在这里,我们提供了两组训练有素的检查点: 英语-越南语: 。 有关如何训练和可视化自己的翻译模型的信息,请参阅 英文-法文: 。 这取自。 :notebook: 交互式反向翻译。 我们使用生成您在上面看到的GIF。 :notebook: 低资源语言的反向翻译案例研究 无监督数据增强[3]
【文件预览】:
dab-master
----decoding.py(13KB)
----gif()
--------attn_viz.gif(1.63MB)
--------envien_demo_fast_v3.gif(6.72MB)
--------vienvi_demo_fast.gif(359KB)
----LICENSE(34KB)
----problems.py(26KB)
----t2t_datagen.py(322B)
----.gitignore(55B)
----t2t_decoder.py(624B)
----t2t_trainer.py(638B)
----back_translate.py(3KB)
----README.md(9KB)
----.gitattributes(66B)
----colab()
--------T2T_translate_vi<_>en_tiny_tpu.ipynb(24KB)
--------Interactive_Back_Translation.ipynb(12KB)
--------Sentiment_Analysis_+_Back_translation.ipynb(27KB)
--------Vietnamese_Backtranslation_Model_Analysis.ipynb(25KB)