文件名称:turkish-language-models:基于 Transformer 的土耳其语模型
文件大小:4KB
文件格式:ZIP
更新时间:2024-06-18 04:08:52
nlp natural-language-processing turkish language-models Python
土耳其语模型 介绍 在这个存储库中,我们发布了基于 Transformer 的土耳其语模型和相关工具。 新模型、数据集、更新和教程即将推出。 请与保持联系。 对于任何问题或请求,请随时提出问题。 我们是一个热情的研发团队,为土耳其 NLP 社区做出贡献,我们需要您的反馈。 您还可以查看我们的实现。 它完全集成了 Python,既不需要 Java 也不需要 JVM。 更新 2020年8月28日,此仓库的初始版本。 2020 年 12 月 8 日使用不同的语料库和训练参数训练了新模型。 微调分数已更新为最佳超参数。 新添加了 bert-cased。 Bert-uncased 已更新。 语言模型 ,, 训练有素的模型 模型 词汇量(千) 训练原始文本数据大小 (GB) 训练步数(百万) 32 200 1 32 40 1 32 40 1 64 200 1
【文件预览】:
turkish-language-models-master
----.gitignore(8B)
----text_normalization.py(2KB)
----README.md(10KB)