文件名称:中文识别经过训练的Tesseract的chi_sim.traineddata中文包
文件大小:111.43MB
文件格式:ZIP
更新时间:2022-04-04 09:51:05
Tesser 训练后的语言
关于中文的识别,效果比较好而且开源的应该就是Tesseract-OCR,此为中文识别经过训练的Tesseract的chi_sim.traineddata中文包
【文件预览】:
tessdata
----COPYING(691B)
----configs()
--------quiet(22B)
--------api_config(27B)
--------pdf(48B)
--------hocr(67B)
--------digits(38B)
--------bazaar(117B)
--------txt(169B)
--------tsv(48B)
--------unlv(48B)
----ukr.traineddata(11.83MB)
----README.md(1KB)
----eng.traineddata(14.69MB)
----osd.traineddata(10.07MB)
----chi_sim.traineddata(50.22MB)
----jpn_vert.traineddata(2.9MB)
----chi_tra.traineddata(64.26MB)
----chi_sim_vert.traineddata(2.36MB)
----pdf.ttf(572B)
----jpn.traineddata(42.32MB)
----chi_tra_vert.traineddata(2.26MB)
----eus.traineddata(9.68MB)