文件名称:textract-demo:通过预处理和后期处理增强Amazon Textract
文件大小:3.77MB
文件格式:ZIP
更新时间:2024-04-20 20:31:09
ocr amazon-textract amazon-a2i Python
端到端智能OCR 高级提取功能超越了简单的OCR来从文档中恢复结构的功能:包括表,键值对(如表单上的表单)以及其他棘手的用例(如多列文本)。 但是,许多实际应用程序需要将此技术与用例特定的逻辑相结合,例如: 预检查提交的图像是高质量的并且是预期的文档类型 将结构化文本的后处理结果放入业务流程级别的字段中(例如,在一个域中,“金额”,“总金额”和“应付金额”可能是同一事物的不同原始注释;而在另一个域中,差异可能很重要! ) 人工审核和再培训流程 该解决方案演示了Textract如何与以下产品集成: 图像预处理逻辑-使用创建不需要ML专业知识的高质量自定义计算机视觉 结果后处理逻辑-使用自定义逻辑以及NLP 审核和数据注释-使用和 ...在一个简单的示例用例中:从收据图像中提取供应商,日期和总金额。 该设计是模块化的,以显示如何可以轻松地针对不同的应用定制此预处理和后处理。 解
【文件预览】:
textract-demo-master
----amplify()
--------.config()
--------team-provider-info.json(3KB)
--------backend()
----images()
--------architecture-overview.png(227KB)
--------screenshot-success.png(350KB)
--------step-function-screenshot.png(98KB)
--------architecture-overview.drawio(3KB)
----.github()
--------worflows()
----amplify.yml(5KB)
----deployment()
--------a2i-cdklambda-stack.ts(2KB)
--------preproc-cdk-Readme.md(939B)
--------deploy.sh(2KB)
----.gitignore(476B)
----Makefile(4KB)
----README.md(6KB)
----.editorconfig(135B)
----source()
--------webui()
--------ocr()