【文件属性】:
文件名称:tesseract ocr 图片文字识别 包括中文包
文件大小:30.57MB
文件格式:RAR
更新时间:2021-09-26 11:36:37
图片文字识别
安装 中文包 支持
https://blog.csdn.net/u012476249/article/details/53307160
在chi_sim.traineddata(注意版本)文件目录下(../Tesseract-OCR/tessdata),使用命令行执行:
combine_tessdata -e chi_sim.traineddata chi_sim.config
执行完后,在目录下出现chi_sim.config的文件,打开该文件;
在allow_blob_division F这一行的前面加#,注释掉
即:# allow_blob_division F
然后,在执行命令行:
combine_tessdata -o chi_sim.traineddata chi_sim.config
【文件预览】:
tesseract
----chi_sim.traineddata(42.31MB)
----tesseract-ocr-setup-3.02.02.exe(12.9MB)