文件名称:pytesseract:Google Tesseract的Python包装器
文件大小:938KB
文件格式:ZIP
更新时间:2024-05-17 13:39:38
Python
Python Tesseract Python-tesseract是用于python的光学字符识别(OCR)工具。 也就是说,它将识别并“读取”图像中嵌入的文本。 Python-tesseract是的包装。 它也可以用作tesseract的独立调用脚本,因为它可以读取Pillow和Leptonica图像库支持的所有图像类型,包括jpeg,png,gif,bmp,tiff等。 此外,如果将Python-tesseract用作脚本,它将打印识别出的文本,而不是将其写入文件。 用法 快速开始 注意:测试图像位于Git存储库的tests/data文件夹中。 图书馆使用情况: try : from PIL import Image except ImportError : import Image import pytesseract # If you don't have
【文件预览】:
pytesseract-master
----setup.py(38B)
----.gitignore(1KB)
----.pre-commit-config.yaml(1KB)
----LICENSE(11KB)
----setup.cfg(871B)
----.github()
--------workflows()
----README.rst(10KB)
----tests()
--------data()
--------pytesseract_test.py(13KB)
--------tessdata()
----pytesseract()
--------__init__.py(601B)
--------pytesseract.py(14KB)
----requirements-dev.txt(18B)
----tox.ini(529B)