djvuhocr:将 hOCR(带有文本对齐的 OCR)生成的文本嵌入到 Djvu 文件中。 依赖

时间:2024-07-13 17:18:13
【文件属性】:

文件名称:djvuhocr:将 hOCR(带有文本对齐的 OCR)生成的文本嵌入到 Djvu 文件中。 依赖

文件大小:10KB

文件格式:ZIP

更新时间:2024-07-13 17:18:13

Perl

为什么是另一个 djvuocr 脚本? 我找不到任何使用 Tesseract 生成的 hOCR 数据的工作脚本。 在注释、搜索和索引方面,缺乏文本定位可能是致命的,因此这个脏脚本。 :) (如果他们修复那个不适用于 djvlibre3.5.26-1 的 ocrodjvu python 模块,那就太好了) 它有什么作用? 它将 hOCR(带有文本对齐的 OCR)文本嵌入到 Djvu 文件中。 支持多线程。 支持页面范围。 依赖 DjvuLibre Tesseract(及其数据文件)


【文件预览】:
djvuhocr-master
----PKGBUILD(714B)
----djvuhocr(4KB)
----LICENSE.md(18KB)
----README.md(573B)

网友评论