language-models:预训练语言模型

时间:2021-05-16 15:04:35
【文件属性】:
文件名称:language-models:预训练语言模型
文件大小:846KB
文件格式:ZIP
更新时间:2021-05-16 15:04:35
JupyterNotebook 语言模型 预先训练的语言模型和NLp模型的存储库。 NLP | 如何将领域特定的词汇表(新令牌)添加到已经受过像BERT WordPiece这样训练的子词令牌生成器中 简介:在某些情况下,为了执行新任务(分类,NER,摘要,翻译,等等。)。 Hugging Face库使您可以轻松地将新标记添加到现有标记器(例如BERT WordPiece)的词汇表中,这些标记必须是整个单词,而不是子单词。 本文解释了为什么以及如何从专门的语料库中获取这些新令牌。 笔记本 ( )( ) 博客文章: NLP | 回答问题的模型,基本的无BERT基础的(葡萄牙语) 笔记本 ( ):葡萄牙BERT基地的训练码套管QA(答疑),微调,对SQUAD V1.1 博客文章: 拥抱面Kong的模型中心中的模型: 葡萄牙语 我使用配置和1个上的NVIDIA GPU v100训练了1个葡萄牙语双向语言模型(P
【文件预览】:
language-models-master
----models()
--------README.md(3KB)
----colab_question_answering_BERT_base_cased_squad_v11_pt.ipynb(251KB)
----lm3-portuguese-classifier-TCU-jurisprudencia.ipynb(265KB)
----lm-french-classifier-amazon.ipynb(179KB)
----lm-french-generator.ipynb(9KB)
----lm3-portuguese-classifier-olist.ipynb(222KB)
----nlputils2.py(6KB)
----lm2-french.ipynb(125KB)
----lm3-french-classifier-amazon.ipynb(245KB)
----lm3-french.ipynb(97KB)
----lm2-french-classifier-amazon.ipynb(308KB)
----README.md(11KB)
----converter.py(6KB)
----lm3-portuguese.ipynb(102KB)
----nlp_how_to_add_a_domain_specific_vocabulary_new_tokens_to_a_subword_tokenizer_already_trained_like_BERT_WordPiece.ipynb(135KB)
----lm-french.ipynb(149KB)

网友评论