PassportEye:通过OCR从护照,签证和身份证中提取机器可读区域信息

时间:2024-06-17 08:40:10
【文件属性】:

文件名称:PassportEye:通过OCR从护照,签证和身份证中提取机器可读区域信息

文件大小:8.9MB

文件格式:ZIP

更新时间:2024-06-17 08:40:10

Python

PassportEye:用于识别文档的图像处理的Python工具 该软件包提供了用于从扫描的身份证明文件中识别机器可读区域(MRZ)的工具。 文档可以在页面上任意放置-代码尝试查找类似于MRZ的内容并从那里进行解析。 识别过程可能很慢-有些文档大约需要10秒钟或更长时间。 它的精度不是很完美,但就开发人员可用的测试文档而言似乎还不错。在大约80%的情况下,只要页面上有清晰可见的MRZ,系统就会识别出该内容并将其提取到底层OCR引擎(Google Tesseract)的最佳功能。 失败的示例似乎通常是扫描得很清晰的文档(文本太模糊),或者更严重的是某些类型的ID(罗马尼亚语是示例),其中MRZ距离卡的其余部分太近了-当前算法无法很好地解决这种情况。 安装 安装软件包的最简单方法是通过pip : $ pip install PassportEye 请注意,PassportEye取决于n


网友评论