文件名称:line-segmentation-algorithm-to-gcp-vision:Google Vision API的线段分割算法
文件大小:2.81MB
文件格式:ZIP
更新时间:2024-05-27 05:17:37
data-extraction invoice segmentation google-vision proposed-algorithm
介绍 Google Vision提供了2种用于光学字符识别(OCR)的选项。 - Option 1: TEXT_DETECTION - Words with coordinates - Option 2: DOCUMENT_TEXT_DETECTION - OCR on dense text to extract lines and paragraph information 第二个选项适用于从文章(诸如新闻报纸/书籍之类的密集文本)中提取数据。 此选项具有智能的分割方法,可以合并附近的单词并形成线段和段落。 此功能对于文本内容稀疏的图像(例如零售发票)是不希望的,其中与同一行相关的数据位于两个角(产品名称和价格之间存在巨大的空白)。 对于这些图像,OCR以不同的顺序分割线。 如果两个单词在一行中的距离相距太远,则Google视觉会将其识别为两个单独的段落/行。 下图显示了来自Goo
【文件预览】:
line-segmentation-algorithm-to-gcp-vision-master
----LICENSE.txt(11KB)
----images()
--------S01200HQT173.jpg(1.18MB)
--------S01200HQU10E.JPG(742KB)
--------S01200HQU351.jpg(1.06MB)
----json()
--------S01200HQU10E.json(1KB)
--------S01200HQU351.jpg.json(133KB)
--------S01200HQU351.json(698B)
--------S01200HQU10E.JPG.json(284KB)
--------S01200HQT173.jpg.json(252KB)
----nodejs()
--------coordinatesHelper.js(5KB)
--------test()
--------ReadME.MD(992B)
--------index.js(4KB)
--------package.json(750B)
----README.md(3KB)
----kotlin()
--------gradlew(6KB)
--------settings.gradle(390B)
--------src()
--------gradlew.bat(3KB)
--------build.gradle(1KB)
----.gitignore(84B)