【文件属性】:
文件名称:pdf-tables-extractor:从PDF文档中提取表格
文件大小:21KB
文件格式:ZIP
更新时间:2021-05-16 21:56:47
Java
PDF表格提取器
围绕简单包装程序,将表提取为CSV并将页面另存为PNG。
一个简单的启发式方法用于在表格顶部过滤相关表格。
输出样本:
doc1.document.json
doc1.page.005.json
doc1.page.005.png
doc1.page.005.table.00.csv
doc1.page.005.table.00.json
doc2.document.json
doc3.document.json
doc3.page.004.json
doc3.page.004.png
doc3.page.004.table.00.csv
doc3.page.004.table.00.json
log-20180527-170650.log
要求
Java 8
下载
请参阅。
跑步
>java -jar tables-extractor-2.0.0-jar-wi
【文件预览】:
pdf-tables-extractor-master
----pom.xml(3KB)
----LICENSE(11KB)
----src()
--------main()
----.gitignore(280B)
----README.md(1KB)