langdata:Tesseract的多种语言的源训练数据

时间:2024-03-14 18:40:00
【文件属性】:
文件名称:langdata:Tesseract的多种语言的源训练数据
文件大小:232.37MB
文件格式:ZIP
更新时间:2024-03-14 18:40:00
语言数据 Tesseract的多种语言的源训练数据 是否想通过修改/扩充原始训练数据来针对特定语言重新训练tesseract? 那么你来对地方了! 如果要查找运行Tesseract的语言数据集,请查看我们的。 要重新创建单一语言lang的训练,您需要以下内容: lang目录中的所有数据。 lang使用的脚本的对应的unicharset / xheights文件。 *目录中所有剩余的非特定于语言的文件,例如font_properties. 您还需要获得训练该语言所需的字体。 某些语言使用了市场上出售的字体进行了培训,因此您需要购买它们才能完全重现该培训或使用替代字体。

网友评论