今天安装tesseract-ocr的时候,载了坑,记录一下。
1. 安装时语言库的选择,我把 aditional language data 这一项全选中了,装的时候那叫一个慢啊,差不多3个小时装好的。如果不是必要的话,建议选择其中的一部分去安装。
2. 安装好了,在命令行里直接输入 “tesseract“ 也是没有问题,但是在实际使用的过程中,总是报错。如下
Traceback (most recent call last): File "C:/Users/Administrator/******.py", line 6, in <module> print(tesserocr.image_to_text(image)) File "tesserocr.pyx", line 2400, in tesserocr._tesserocr.image_to_text RuntimeError: Failed to init API, possibly an invalid tessdata path: C:\ProgramData\Anaconda3\
最简单的解决方法,一个是检查环境变量的问题。
另一个就是,将C:\Program Files (x86)\Tesseract-OCR目录(tesseract-ocr默认安装目录)下的tessdata文件夹拷贝到C:\ProgramData\Anaconda3目录,就是报错信息的最后,那个目录。
有问题可以留言,可能解决方法并不适用各种情况,大家一起研究。