中文识别经过训练的Tesseract的chi_sim.traineddata中文包

时间:2022-04-04 09:51:05
【文件属性】:

文件名称:中文识别经过训练的Tesseract的chi_sim.traineddata中文包

文件大小:111.43MB

文件格式:ZIP

更新时间:2022-04-04 09:51:05

Tesser 训练后的语言

关于中文的识别,效果比较好而且开源的应该就是Tesseract-OCR,此为中文识别经过训练的Tesseract的chi_sim.traineddata中文包


【文件预览】:
tessdata
----COPYING(691B)
----configs()
--------quiet(22B)
--------api_config(27B)
--------pdf(48B)
--------hocr(67B)
--------digits(38B)
--------bazaar(117B)
--------txt(169B)
--------tsv(48B)
--------unlv(48B)
----ukr.traineddata(11.83MB)
----README.md(1KB)
----eng.traineddata(14.69MB)
----osd.traineddata(10.07MB)
----chi_sim.traineddata(50.22MB)
----jpn_vert.traineddata(2.9MB)
----chi_tra.traineddata(64.26MB)
----chi_sim_vert.traineddata(2.36MB)
----pdf.ttf(572B)
----jpn.traineddata(42.32MB)
----chi_tra_vert.traineddata(2.26MB)
----eus.traineddata(9.68MB)

网友评论

  • 对不起这个分,只是把官网的包整合一下。
  • 好资源,谢谢
  • 假的,官网下载的多个语言打包的
  • 还没开始使用,但更大的应该是更好吧