文件名称:pdf-scrape:PDF文本抓取
文件大小:81KB
文件格式:ZIP
更新时间:2024-06-18 03:30:58
JavaScript
PDF-抓取 PDF文本抓取 抽象的 PDF-Scrape 是一个小型应用程序编程接口 (API) 和命令行接口 (CLI),用于从 PDF 文档中抓取文本。 它旨在作为预处理步骤,通过 PDF 文档中的文本片段查找锚位置,以便随后使用 pdftocairo(1) 等工具抓取实际 PDF 文档的这些区域(SVG 或 PNG 格式)。 安装 $ npm install -g pdf-scrape 用法 和的 Unix 手册页包含详细的使用信息。 执照 版权所有 :copyright: 2020-2021 Dr. Ralf S. Engelschall ( ) 特此免费授予获得此软件和相关文档文件(“软件”)副本的任何人无限制地处理软件的权利,包括但不限于使用,复制,修改,合并的权利,发布,分发,再许可和/或出售本软件的副本,并允许具备软件的人员这样做,但须满足以下条件: 上述版权声明和本许可声明应包含在
【文件预览】:
pdf-scrape-master
----pdf-scrape-api.d.ts(3KB)
----.gitignore(109B)
----package.json(2KB)
----Makefile(3KB)
----README.md(2KB)
----.npmignore(70B)
----sample.pdf(70KB)
----pdf-scrape-api.js(5KB)
----pdf-scrape-api.md(2KB)
----pdf-scrape-cli.js(7KB)
----eslint.yaml(3KB)
----pdf-scrape-cli.md(2KB)