demo_tesseract:Tesseract OCR演示

时间:2024-03-16 18:20:17
【文件属性】:

文件名称:demo_tesseract:Tesseract OCR演示

文件大小:9KB

文件格式:ZIP

更新时间:2024-03-16 18:20:17

Shell

Tesseract OCR演示 将.pdf文件转换为图像。 使用tesseract将转换后的图像转换为x格式。 去做: 将结果写入数据库。 将tesseract识别的单词和组绘制到图像上。 用法 Ubuntu 20.04 bash 0_install_and_setup_tools.sh 将一些pdf文件复制到testfiles / (要运行单个pdf文件,请修改并运行:bash 1_test_some_files.sh) 运行所有pdf文件运行bash 2_convert_all_pdfs.sh


【文件预览】:
demo_tesseract-main
----.gitignore(18B)
----README.md(458B)
----output_image()
--------.keep(0B)
----tesseract_demo_functions.sh(3KB)
----database()
--------database_common.ddl(358B)
--------create_database.sh(313B)
--------database_tesseract.ddl(3KB)
----clean.sh(90B)
----test_gimagereader()
--------test_gimagereader.sh(602B)
--------setup_gimagereader.sh(43B)
----test_python()
--------purge_python2.sh(66B)
--------setup_python_test.sh(73B)
--------python_testaa_pytesseract.py(2KB)
----output_tesseract()
--------.keep(0B)
----2_convert_all_pdfs.sh(148B)
----0_install_and_setup_tools.sh(3KB)
----1_test_some_files.sh(572B)
----output_pytesseract()
--------.keep(0B)

网友评论