pretrained-models:开放语言预训练模型动物园

时间:2024-05-27 13:24:32
【文件属性】:

文件名称:pretrained-models:开放语言预训练模型动物园

文件大小:21KB

文件格式:ZIP

更新时间:2024-05-27 13:24:32

开源预训练语言模型合集 这是由追一科技有限公司推出的一个预训练模型合集,主要发布自研的预训练语言模型,推动自然语言处理技术的进步。预训练语言模型通过在大规模文本上进行预训练,可以作为下游自然语言处理任务的模型参数或者模型输入以提高模型的整体性能。 模型概览 以下是我们目前公开发布的模型概览: 名称 数据来源 训练数据大小 词表大小 模型大小 下载地址 RoBERTa Tiny 百科,新闻 等 35G 21128 27MB (mrcv) RoBERTa Small 百科,新闻 等 35G 21128 48MB (j2ns) SimBERT Tiny 2200万相似句组 13685 26MB (1tp7) SimBERT Small 2200万相似句组 13685 49MB (nu67) SimBERT Base 2200万相似句组 13685 344MB (6xhq) RoBERTa+ Ti


【文件预览】:
pretrained-models-master
----examples()
--------task_sentiment.py(5KB)
--------task_lic2019_ie.py(12KB)
--------task_iflytek.py(4KB)
--------simbert_base.py(3KB)
--------task_cips_sogou_qa.py(11KB)
----LICENSE(11KB)
----README.md(10KB)

网友评论