ocr_image_to_text:使用tesseract软件对pdf jpg和png文件执行ocr的python脚本

时间:2024-03-13 00:06:29
【文件属性】:

文件名称:ocr_image_to_text:使用tesseract软件对pdf jpg和png文件执行ocr的python脚本

文件大小:5KB

文件格式:ZIP

更新时间:2024-03-13 00:06:29

Python

ocr_image_to_text 使用tesseract软件在pdf jpg和png文件上执行ocr的python脚本 构建说明:该项目需要两次下载,用于OCR的Tesseract和用于pdf转换的Poppler可以从下载Tesseract可执行文件。 Windows,您必须将tesseract添加到Windows路径 该项目在名为anaconda的虚拟python环境中运行。 Anaconda可以从下载并安装。 poppler可以通过运行anaconda来安装 conda install -c conda-forge poppler 安装完这些后,您可以通过运行以下命令将所有要求安装在requirments.txt中: pip install -r requirements.txt 运行说明:运行该应用程序,导航至带有python应用程序的文件夹并输入 python ocr_te


【文件预览】:
ocr_image_to_text-master
----.idea()
--------ocr_image_to_text.iml(395B)
--------misc.xml(288B)
--------vcs.xml(180B)
--------modules.xml(286B)
--------.gitignore(39B)
--------inspectionProfiles()
----ocr_text.py(3KB)
----requirements.txt(63B)
----README.md(1KB)

网友评论