img2txt:使用 Google Vision API 从图像中轻松提取格式化文本

时间:2024-06-17 19:16:53
【文件属性】:

文件名称:img2txt:使用 Google Vision API 从图像中轻松提取格式化文本

文件大小:155KB

文件格式:ZIP

更新时间:2024-06-17 19:16:53

python machine-learning ocr table tabular-data

图像到文本转换实用程序 您可以在此处找到一个小型标记化实用程序以及使用 Google Vision API 从图像中提取表格的示例。 Google 提供了一个很好的 OCR 来从图像中提取文本,但有时输出并不是最好的,在这个存储库中,我提供了一个简单的输出后处理,以便更容易使用 API 输出。 动机 Google OCR提供的文本输出可能没有预期的格式,如果是这种情况,它还会提供JSON输出,其中包含有关每个可识别实体位置的信息。 问题在于,对于某些任务而言,此数据的结构不是很好,使用此JSON提取令牌(彼此之间没有空格的字符序列)并不是那么容易,因为它没有直接提供此信息。 这样做的目的是提供一种将这些数据后处理为更易于处理的方式的方法,因此它更适合于文本处理任务,例如提取整行文本或过滤单词。 为此,在image2tokens.py提供了后处理代码。 这用于提取标记,然后提取更抽象的概念


【文件预览】:
img2txt-master
----googleVisionApi.py(864B)
----image2tokens.py(2KB)
----sample()
--------input()
--------output()
----LICENSE(1KB)
----credential.json(0B)
----requirements.txt(26B)
----README.md(4KB)
----ocr.py(809B)
----table_example.py(1KB)

网友评论