tesseract-ocr安装问题

时间:2022-08-30 09:00:56

今天安装tesseract-ocr的时候,载了坑,记录一下。

1. 安装时语言库的选择,我把 aditional language data 这一项全选中了,装的时候那叫一个慢啊,差不多3个小时装好的。如果不是必要的话,建议选择其中的一部分去安装。

2. 安装好了,在命令行里直接输入 “tesseract“  也是没有问题,但是在实际使用的过程中,总是报错。如下

Traceback (most recent call last):
  File "C:/Users/Administrator/******.py", line 6, in <module>
    print(tesserocr.image_to_text(image))
  File "tesserocr.pyx", line 2400, in tesserocr._tesserocr.image_to_text
RuntimeError: Failed to init API, possibly an invalid tessdata path: C:\ProgramData\Anaconda3\

最简单的解决方法,一个是检查环境变量的问题。

另一个就是,将C:\Program Files (x86)\Tesseract-OCR目录(tesseract-ocr默认安装目录)下的tessdata文件夹拷贝到C:\ProgramData\Anaconda3目录,就是报错信息的最后,那个目录。

有问题可以留言,可能解决方法并不适用各种情况,大家一起研究。