三款常见的OCR识别控件功能对比

　　 Atalasoft成立于2000年，是一家来自美国马萨诸塞州的软件公司，其致力于为全球的软件开发公司及开发者提供优秀的商用图像处理软件及开发应用控件。他们的众多客户都是来自"财富"500强的 图形软件开发公司， 图形引擎开发公司及其他软件开发公司。

　　旗下产品DotImage OCR是一个光学字符识别模块，使你的程序具备字符识别能力，提供OCR引擎界面。

具体功能：

全面的可扩展的文件和流导出
OCR 引擎本地化，公开的API
嵌入的图片处理功能
支持字体提取
事件处理跟踪报告，文档布局修改
可以以区域，行，单词或文字的形式识别
可以识别任何被DotImage支持的图片
可以很容易地与扫描整合
识别的图片可以来自任何地方，并不只是文件
内嵌文本转换，用于格式化文本输出
支持自动定位图片区域
支持Tesseract OCR Engine
支持GlyphReader OCR Engine
支持 Abbyy OCR Engine

　　Lead Technology公司是一家私人公司，它由Moe Daher and Rich Little创建于1990年，其总部设在北卡罗来纳州夏洛特。LEAD的建立是为了使Daher先生在数码图象与压缩技术领域的发明面向市场。在过去超过18年的发展历程中，LEAD以其在全世界主要国家中占有的市场领导地位，在数码图象开发工具领域中已成为既定的全球领导者。LEAD是屡获殊荣的开发工具包--LEADTOOLS的开发商与发布商。

　　旗下产品LEADTOOLS OCR SDK 用于在应用程序中添加光学字符识别技术。使用 LEADTOOLS OCR模块，编程人员可以对文档图像进行字符识别，并能把识别出的字符输出到20多种文件格式中，包括DOC、RTF、HTML、TXT、XLS，以及其它更多。 LEAD的OCR工具提供了API、COM和.Net支持，PDF OCR插件则扩展了LEADTOOLS OCR模块对PDF输出的支持。

输出格式支持

可编辑的 Adobe PDF 文档
Open eBook 1.0
XML
2G Type 2
2G Type 3

其它特征

认别5到72点任何可能字体的文字。
在文档页面自动检测可能的文字区域。
一次即可对多个文档页面进行认别，并保存识别结果到单个文件中。OCR引擎能识别多种语言的文档。
可以选择从文本、文字处理、数据库、电子表格等多种文件格式(包括MS Word、PDF、MS Excel)进行文字识别和输出。
针对双面的书和杂志在“两页”模式进行文档处理。

　　Pegasus Imaging公司专注于数字图像软件的开发和压缩技术，公司了解世界市场的需要，并提供最优秀的技术。自1991年开始，Pegasus服务于以下市场：Document, Medical, Photo, Video 和 Embedded Solutions，Pegasus并提供以下解决方案：viewing, scanning, printing, barcode, OCR, ICR, OMR, MICR, CAD viewing, compression (包括JPEG2000, JPEG, wavelet, TIFF and lossless JPEG)，以及其他内容。

　　旗下SmartZone™光学字符识别工具包，使开发人员能够进行带状区域光学字符识别，带状区域在表单处理应用程序中经常使用。本产品所包含的.NET控件以及ActiveX COM组件在内部使用两种单独的识别技术来共同校验处理结果，因此能有效提高识别的准确率。

具体功能：

编程环境：Win32可视化开发环境。
本产品包含有适用于以下语言的示例代码：VB.NET、C#、VB、Delphi、VC++、HTML。
为 .NET用户提供的面向对象（Object-oriented）的应用程序编程接口（API）。
可以在.NET平台下以一个托管控件的形式部署，并且能够与.NET 1.0及以上版本完全兼容。
可以在任何可以包容ActiveX COM（组件对象模型）控件的开发环境下使用。
可在多线程的环境下使用。
支持用户设定的调式日志记录级别。
具有客户端/服务器模式的Web应用开发能力。
执行各种黑白图像处理操作（可能是将彩色资源图像转换成黑白图像）。
具有两种可选的处理速度（标准以及专业版本）。
用户可以立即下载本产品功能完整的免费试用版本。

区域定义以及处理

在设定的区域执行识别操作。
在设定的区域执行图像清除操作。

光学字符识别（OCR）

使用预定义的字符集来识别文本，包括大写字母、小写字符、大小写混合字符串、数字、货币符号、数字以及货币符号的组合、算术符号以及标点符号。
用户可以将识别操作的操作对象限定为产品支持的字符集的一个用户自定义的子集。
为每一个单独的字符返回可信度值，以及完整的OCR（光学字符识别）结果，以便能帮助用户管理识别处理过程。
返回多个与可信度值关联的字符结果。
当对某一个字符进行识别处理失败时，本产品将设定一个拒绝字符。
设定可信度级别，当可信度小于这个级别值时，本产品将返回一个拒绝字符。
设定识别操作的分割参数。
只支持英语字符。

图像输入、图像输出以及图像处理

本产品包含有ImagXpress Standard控件（阅读完整的ImagXpre，用户可以使用它来基本的图像转换、图像处理以及TWAIN扫描等操作。
支持与其它组件的图像数据传输。

黑白图像清除

　　本产品的专业版本和标准版本均包含有ScanFix Xpress Lite控件此控件能够提供各种高级黑白图像清除技术支持，例如：偏斜校正（deskew）、斑点移除

（despeckle）、旋转、镜像（mirror）、翻转（flip）等各种功能。

国内OCR 汉王青丹清华

http://www.hw99.com/

gdc2pic、TextFerver

http://www.jitech.cn/chanpinjieshao8.html

人类中语音和图像与编码三者反反复进行着转换

秒客网

三款常见的OCR识别控件功能对比

相关文章