pdf_order_parser:从PDF读取订单数据,将其作为哈希返回

时间:2024-04-23 14:13:06
【文件属性】:

文件名称:pdf_order_parser:从PDF读取订单数据,将其作为哈希返回

文件大小:34KB

文件格式:ZIP

更新时间:2024-04-23 14:13:06

Ruby

pdf_order_parser 故事 从头开始,找到一个有用的库,学习如何使用它 阅读问题描述后,我去寻找了一个宝石来从PDF中获取数据。 对于大多数算法问题,我倾向于依赖Ruby的标准库,但这有所不同:一种全球通用的文档格式,它对程序员的友好程度不高,但广泛用于商业信息,因此我认为可能有一些在那里可以与PDF一起使用。 我按以下顺序找到了以下内容: [ pdf-reader gem] [pdf阅读器] [ pdf-reader-turtletext gem] [pdf-reader-turtletext],是pdf-reader的扩展,它允许您通过正则表达式和其他一些约束来指定PDF中的边界框区域以提取数据(这大概会有所帮助)我忽略了与手头任务无关的文档中的数据/文本) 我以前从未以编程方式使用过PDF,而且我认为pdf-reader-turtletext工作方式非常有趣,因此


【文件预览】:
pdf_order_parser-master
----sample_order_confirmation.pdf(30KB)
----.ruby-version(6B)
----pdf_order_parser.rb(299B)
----.rbenv-gemsets(17B)
----Gemfile(63B)
----TODO.txt(265B)
----README.md(5KB)
----pdf_order_parser_test.rb(2KB)
----Gemfile.lock(262B)
----.gitignore(10B)

网友评论