unilm:UniLM-NLP及更高版本的统一语言模型预培训

时间:2024-02-24 08:59:51
【文件属性】:

文件名称:unilm:UniLM-NLP及更高版本的统一语言模型预培训

文件大小:425KB

文件格式:ZIP

更新时间:2024-02-24 08:59:51

nlp language-generation language-understanding pre-trained-model document-understanding

UniLM 预训练的自然语言理解(NLU)和生成(NLG)任务模型 UniLM系列: ( v1@NeurIPS'19 | v2@ICML'20 ):语言理解和生成的统一预培训 ( new ):用于语言理解和生成的多语言/跨语言预训练模型 ( v1@NeurIPS'20 ):用于语言理解和生成的小型预训练模型 ( v1@KDD'20 | v2 ):用于文档理解(例如,扫描的文档,PDF等)的多模式(文本+布局/格式+图像)预训练 :序列到序列微调工具包 ( NEW ):带预训练的跨语言编码器的多语言NMT 新闻 2020年12月29日: 随新的SOTA一起发布,用于各种文档AI任务,包括和排行榜。 2020年10月8日:T-ULRv2(又称 )作为排行榜上的SOTA。 // 2020年9月: 被NeurIPS 2020接受。 2020年7月16日( NEW ): 2020年6月: 被ICML 2020接受; 已被KDD 2020接受。 2020年4月5日:发布 ! 2019年9月: 被NeurIPS 2019接受。 释放 ***** New February,


【文件预览】:
unilm-master
----NOTICE.md(12KB)
----.github()
--------ISSUE_TEMPLATE()
----layoutlm()
--------mypy.ini(846B)
--------.flake8(497B)
--------layoutlm()
--------examples()
--------.isort.cfg(204B)
--------setup.py(736B)
--------README.md(10KB)
--------.pre-commit-config.yaml(667B)
--------.gitignore(4KB)
----unilm-v1()
--------src()
--------README.md(20KB)
----xlmt()
--------README.md(1B)
----CONTRIBUTING.md(921B)
----LICENSE(1KB)
----minilm()
--------examples()
--------README.md(16KB)
----README.md(7KB)
----s2s-ft()
--------run_seq2seq.py(20KB)
--------s2s_ft()
--------gen_seq_from_trace.py(7KB)
--------setup.py(1KB)
--------README.md(14KB)
--------.gitignore(2KB)
--------decode_seq2seq.py(13KB)
--------evaluations()
----CODE_OF_CONDUCT.md(453B)
----.gitignore(1KB)
----storage()
--------unilm-base-cased-config.json(563B)
--------unilm-large-cased-config.json(563B)
--------unilm-base-cased-vocab.txt(208KB)
--------unilm-large-cased-vocab.txt(208KB)
----infoxlm()
--------README.md(726B)
----unilm()
--------README.md(2KB)

网友评论