【文件属性】:
文件名称:PDFJuice:从PDF文档中提取格式化信息
文件大小:8.54MB
文件格式:ZIP
更新时间:2021-02-11 05:43:57
html pdf slides tables Java
介绍
该项目提供了一些工具,可以帮助用户从PDF文档中提取结构化信息。 目前,该程序能够将它们导出为HTML。
PDFJuice依赖于来读取PDF文档。
到目前为止,有两种功能可用:
提取表。
提取幻灯片。
该项目是。
编译
编译依赖项:
mvn compile package assembly:single
用法
生成示例:
输出文件已在存储库中可用。 它们将被覆盖。
java -cp target/PDFJuice-1.3-SNAPSHOT-jar-with-dependencies.jar org.sj.tools.pdfjuice.ExampleGenerator
在特定文件上使用
java -cp target/PDFJuice-1.3-SNAPSHOT-jar-with-dependencies.jar org.sj.tools.pdfjuice.PDFJuic