camelot:Camelot:人类的PDF表提取

时间:2024-03-14 22:59:29
【文件属性】:

文件名称:camelot:Camelot:人类的PDF表提取

文件大小:17.3MB

文件格式:ZIP

更新时间:2024-03-14 22:59:29

pdf table extract for-humans Python

Camelot:适用于人类的PDF表提取 Camelot是一个Python库,任何人都可以轻松地从PDF文件中提取表格! 注意:您还可以签出 ,这是Camelot的Web界面! 这是从PDF文件提取表格的方法。 在查看此示例中使用的PDF。 >>> import camelot >>> tables = camelot.read_pdf('foo.pdf') >>> tables >>> tables.export('foo.csv', f='csv', compress=True) # json, excel, html, sqlite >>> tables[0]

>>> tables[0].parsing_report { 'accuracy': 99.02, 'whitespace':


网友评论

  • 感觉没什么用