BARThez:法国序列对预训练模型进行序列化

时间:2024-05-28 22:46:15
【文件属性】:

文件名称:BARThez:法国序列对预训练模型进行序列化

文件大小:3.62MB

文件格式:ZIP

更新时间:2024-05-28 22:46:15

Python

巴特兹 用于对预训练模型进行排序的法语序列。 [ ] 介绍 基于法国序列到序列预训练模型。 BARThez通过学习重构受损的输入句子来进行预训练。 使用66GB的法语原始文本语料库进行预训练。 与已经存在的基于BERT的法语模型(例如CamemBERT和FlauBERT)不同,BARThez特别适合生成任务,因为不仅对其编码器而且对解码器都进行了预训练。 除了从头开始进行预训练的BARThez之外,我们还将继续对多语言BART ,从而提高了其在判别性任务和生成性任务中的性能。 我们将其称为法文改编版本mBARThez。 模型 建筑学 #layers #params 关联 巴特兹 根据 12 216M mBARThez 大 24 561M 在拥抱的脸上 我们的模特现在正紧紧拥抱着! 巴特兹 BARThez对抽象生成进行了微调 BARThez在标题生成上进行了微调 总结 首先


网友评论