【文件属性】:
文件名称:pdf-scrape:PDF文本抓取
文件大小:81KB
文件格式:ZIP
更新时间:2021-05-29 09:44:18
JavaScript
PDF-抓取
PDF文本抓取
抽象的
PDF-Scrape 是一个小型应用程序编程接口 (API) 和命令行接口 (CLI),用于从 PDF 文档中抓取文本。 它旨在作为预处理步骤,通过 PDF 文档中的文本片段查找锚位置,以便随后使用 pdftocairo(1) 等工具抓取实际 PDF 文档的这些区域(SVG 或 PNG 格式)。
安装
$ npm install -g pdf-scrape
用法
和的 Unix 手册页包含详细的使用信息。
执照
版权所有 :copyright: 2020-2021 Dr. Ralf S. Engelschall ( )
特此免费授予获得此软件和相关文档文件(“软件”)副本的任何人无限制地处理软件的权利,包括但不限于使用,复制,修改,合并的权利,发布,分发,再许可和/或出售本软件的副本,并允许具备软件的人员这样做,但须满足以下条件:
上述版权声明和本许可声明应包含在
【文件预览】:
pdf-scrape-master
----pdf-scrape-api.d.ts(3KB)
----.gitignore(109B)
----package.json(2KB)
----Makefile(3KB)
----README.md(2KB)
----.npmignore(70B)
----sample.pdf(70KB)
----pdf-scrape-api.js(5KB)
----pdf-scrape-api.md(2KB)
----pdf-scrape-cli.js(7KB)
----eslint.yaml(3KB)
----pdf-scrape-cli.md(2KB)