安装Tesseract
tesserocr是Python的一个OCR识别库,但其实是对tesseract做的一层Python API封装,所以它的核心是tesseract,因此安装tesserocr之前,需要先安装tesseract.
这里我安装的是 tesseract-ocr-setup-3.05.02-20180621.exe
安装的语言包的时候,耐心等待,会很久。
验证安装
安装成功之后验证图片:
在命令行下输入:tesseract image.png stdout -l eng
Tesseract配置环境变量
配置TESSDATA_PREFIX:
添加至Path变量:
复制tessdata整个文件夹至Python安装目录中:
安装Tesserocr
遇到的很坑的就是在安装Tesserocr的时候,pip3 install pillow命令并没有那么顺利
问题一:pip3 install pillow错误如下:
先不要着急去安装Microdoft Visual C++ 14.0,我们换一种安装方式
首先下载对应的.whl文件,一定要与tesseract版本配对:
运行命令:pip3 install tesserocr-2.2.2-cp36-cp36m-win_amd64.whl
问题来了,并不能安装成功,反而提示:tesserocr-2.2.2-cp36-cp36m-win_amd64.whl is not a supported wheel on this platform
解决如下:查看pip支持的文件名还有版本
但是tesserocr暂时没有看到cp37的版本.whl文件,由于我目前本地是python3.7.0
所以最终,我选择将python版本往下降,重新安装了python3.6.6
然后再次运行:pips install tesserocr-2.2.2-cp36-cp36m-win_amd64.whl
验证安装