Tesseract OCR win 32位编译

时间:2023-01-02 22:42:07
https://github.com/tesseract-ocr/tesseract/wiki/Compiling

找到该标题:Develop Tesseract
按照上面的步骤执行即可,最后使用 vs2015 打开 sln 工程文件,编译。 编译过程中,会报一些错,把报错的文件编码格式更改 gbk 的即可。 然后下载数据文件
https://github.com/tesseract-ocr/tesseract/wiki/Data-Files
这里就下载英文和中文,
eng.traineddata
chi_sim.traineddata 使用命令行工具测试控制台程序是否运行正常 tesseract.exe 图片路径 结果保存路径 语言设置
例子:
tesseract.exe c:\img200W.jpg c:\result.txt -l eng+chi_sim