文件名称:PDFJuice:从PDF文档中提取格式化信息
文件大小:8.54MB
文件格式:ZIP
更新时间:2024-03-02 23:30:37
html pdf slides tables Java
介绍 该项目提供了一些工具,可以帮助用户从PDF文档中提取结构化信息。 目前,该程序能够将它们导出为HTML。 PDFJuice依赖于来读取PDF文档。 到目前为止,有两种功能可用: 提取表。 提取幻灯片。 该项目是。 编译 编译依赖项: mvn compile package assembly:single 用法 生成示例: 输出文件已在存储库中可用。 它们将被覆盖。 java -cp target/PDFJuice-1.3-SNAPSHOT-jar-with-dependencies.jar org.sj.tools.pdfjuice.ExampleGenerator 在特定文件上使用 java -cp target/PDFJuice-1.3-SNAPSHOT-jar-with-dependencies.jar org.sj.tools.pdfjuice.PDFJuic