PDFJuice:从PDF文档中提取格式化信息

时间:2024-03-02 23:30:37
【文件属性】:

文件名称:PDFJuice:从PDF文档中提取格式化信息

文件大小:8.54MB

文件格式:ZIP

更新时间:2024-03-02 23:30:37

html pdf slides tables Java

介绍 该项目提供了一些工具,可以帮助用户从PDF文档中提取结构化信息。 目前,该程序能够将它们导出为HTML。 PDFJuice依赖于来读取PDF文档。 到目前为止,有两种功能可用: 提取表。 提取幻灯片。 该项目是。 编译 编译依赖项: mvn compile package assembly:single 用法 生成示例: 输出文件已在存储库中可用。 它们将被覆盖。 java -cp target/PDFJuice-1.3-SNAPSHOT-jar-with-dependencies.jar org.sj.tools.pdfjuice.ExampleGenerator 在特定文件上使用 java -cp target/PDFJuice-1.3-SNAPSHOT-jar-with-dependencies.jar org.sj.tools.pdfjuice.PDFJuic


网友评论