transformpdftoxls:使用 Tabula-extractor 和 axlsx 从 PDF 文件中提取表格到 xls 文件

时间:2024-08-01 01:52:46
【文件属性】:

文件名称:transformpdftoxls:使用 Tabula-extractor 和 axlsx 从 PDF 文件中提取表格到 xls 文件

文件大小:2KB

文件格式:ZIP

更新时间:2024-08-01 01:52:46

Ruby

安装 1)RVM安装 sudo apt-get install curl \curl -sSL | bash -s 稳定 --rails 源 ~/.rvm/scripts/rvm echo "源 ~/.rvm/scripts/rvm" >> ~/.bashrc Tabula 提取器安装 ( ) rvm install jruby(tabula-extractor 仅适用于 JRuby 1.7 或更新版本) jruby -S gem 安装 tabula-extractor AXLSX 安装 ( ) gem 安装 axlsx 执行 编辑文件以更新要使用的目录和pdf的名称 a) 将一个 pdf 文件提取到一张 xls 工作表中,每个标签有一个标签 Ruby提取阵列.rb b) 将一个 pdf 文件提取为多个 csv 文件(每个选项卡一个文件) Ruby提取数组Csv.


【文件预览】:
transformpdftoxls-master
----extractArraysCsv.rb(500B)
----README.md(743B)
----extractArrays.rb(633B)

网友评论