文件名称:europeana-bert:BERT和ELECTRA模型在Europeana报纸上接受培训
文件大小:42KB
文件格式:ZIP
更新时间:2024-06-11 13:53:44
Python
Europeana BERT和ELECTRA型号 在此存储库中,我们开放了在各种Europeana报纸上接受培训的BERT和ELECTRA模型的源代码。 注意:我们使用由欧洲图书馆提供的开源。 但是,欧洲图书馆被永久关闭(2019年底),因此所有直接下载链接都不再起作用。 我们正在努力提供替代下载镜像。 变更日志 06.02.2021:德国European DistilBERT和ConvBERT模型的公开发布 2020年11月16日:法国Europeana BERT和ELECTRA模型的公开发布 2020年7月26日:德国Europeana ELECTRA模型公开发布 10.02.2020:此仓库的初始版本 型号类型 我们训练了不同的模型,在以下论文中对其进行了详细描述: 德国欧洲报纸 我们使用来自Europeana语料库的language元数据属性提取了所有德语文本。 统计资料 生成
【文件预览】:
europeana-bert-main
----LICENSE(1KB)
----flair-ner-trainer.py(3KB)
----french_year_token_stats.png(35KB)
----README.md(12KB)
----german_year_token_stats.png(36KB)
----flair-ner-predictor.py(2KB)