【转载】移动医疗领域OCR技术的应用

来源： https://www.valuelink.cn/mob/en/detail.html?id=58

一、什么是OCR技术

OCR技术是光学字符识别的缩写(Optical Character Recognition)，是通过扫描等光学输入方式将各种票据、报刊、书籍、文稿及其它印刷品的文字转化为图像信息，再利用文字识别技术将图像信息转化为可以使用的计算机输入技术。衡量一个OCR系统性能好坏的主要指标有：拒识率、误识率、识别速度、稳定性，易用性等。通过OCR技术，用户可以将通过摄像机、扫描仪等光学输入方式得到的书籍、文稿、表格等印刷品的图像信息转化为可以供计算机识别和处理的文本信息。因此，与传统的手工录入方式相比，OCR技术大大提高了人们进行资料存储、检索、加工的效率。

二、医疗领域OCR技术的应用

－应用方向

在就医流程中，患者无法避免的会遇到纷繁复杂的纸质医疗单据和难以理解的符号数据。如何能够轻松的将这些单据上的内容电子化存储并转换为易懂的解释，一直是困扰患者题，也是创业者一直思考的问题。OCR技术在医疗领域的应用，刚好提供了一个解决方案。

从医疗领域C端角度分析，OCR技术最常见的应用是化验单的识别。该应用不仅可以帮助患者长期存储化验单，同时还可以进行一定分析。除此以外，还有处方识别、病例存档等方面应用。从B端来看，OCR技术主要应用于医疗数据分析、医生科研、保险公司、医药研究、硬件开发、医院管理等领域，帮助其提高对数据录入与分析方面的工作效率。

－需求来源

医疗领域OCR技术的需求是强烈存在的。首先，从C端用户角度来看，大部分患者自己无法全面且正确的解读化验单，而医生也没时间帮助患者进行解读与分析。通过OCR技术识别化验单可以帮助患者解决读不懂化验单的问题。其次，从B端来讲，许多医疗科研公司、保险公司、药企公司等都需要大量的检验数据，而传统的手动输入费时费力、效率低下。OCR技术为其节约了大量的人力和时间成本。

－ OCR技术应用流程：以医疗单据为例

定位区域：通过移动设备对医疗单据进行拍照，识别技术会先清晰找到单据的边框，定位单据大致位置。
区域分类：对已经识别的单据信息进行第一次区域分类，大体划分出患者信息区域、医院信息区域以及检验项目区域等。其中检验项目是最为重要的，也是内容最为丰富和复杂的。
解析数据：区域分类以后，开始对各个区域内的内容进行第二次识别，提取时间地点、患者信息和医院信息等基础内容。对检验项目的数据与符号进行智能解析与理解，并与医疗数据库的内容进行匹配。
调整审核：数据解析过后，需要通过大部分智能审核和少部分人工审核对解析出来结果进行整体优化和调整，对其中可能识别错误的地方进行修正。
上传SaaS：将用户数据上传至SaaS云端进行存储
用户接收：数据的最终处理结果将返回到用户手中并随时等待调用。

－目前移动医疗领域OCR技术的应用难点

医疗领域OCR技术难点主要存在于识别和分析标准两方面。

首先，由于各医院使用的单据格式、版面并没有统一标准，使得单据的界面十分复杂。纸质单据难以保存。患者拍摄的单据由于折叠等原因清晰度低，增加了OCR技术的辨认难度。单据上大多是复杂类型字符混排的情况，对于识别技术有很高的要求。

其次，由于医学的复杂性与严谨性，不同名词可能代表的含义是相同的，而同一个名词在不同的检验项目中所代表的意义和标准值是不一样的。在分析数据前，需要建立完整且准确的医疗数据库，并且在技术上防止因符号相同导致的识别与分析错误。