ABBYY FineReader 15(Windows系统)新增智能PDF文档转换功能,可自动检测导入PDF数字文档的文本层质量,确保转变为可编辑格式后的准确结果;从表单字段和文本框中提取文本,准确保留交互式PDF形式字段。
ABBYY FineReader 15 OCR文字识别软件中的OCR 编辑器可让用户检查识别区域、验证识别出的文本、预处理图像以提高 OCR精确性等等。
图-1 ABBYY FineReader 15
单击打开选项卡,然后左键单击转换为PDF、Microsoft Word、Excel等多种格式。
图-2 转换文档
ABBYY FineReader 15(Windows系统)新增智能PDF文档转换有如下功能:
一、文本层质量检测
ABBYY FineReader 15 OCR文字识别软件在处理添加的数字PDF文档时,会对PDF文档进行智能检测,以检查文本层质量。如果页面中的文本层被识别到有问题(损坏、编码问题等),ABBYY FineReader 15软件将应用OCR来转换此类页面而不是之间提取文本层。这项功能帮助用户在原生数字PDF转换为可编辑格式时获得最准确的结果。
图-3 文本层质量检测
二、字段中的文本和注释检测
ABBYY FineReader 15软件允许从交互式PDF形式的字段和“文本框”(也称为“Typewriter”)类型的注释中提取文本。这项功能可帮助用户将此类PDF转换为可编辑的格式时,准确可靠的将字段、注释等保留。
图-4 字段中的文本和注释检测
三、布局保留得到改善
ABBYY FineReader 15软件把PDF数字文档转换为可编辑格式时,重新构建的页面布局也得到了改善。对比原PDF文档与转换过后的Word文档,输出的文档与原件相似度高。
图-5 原PDF文档
图-6 转换后的Word文档
通过使用ABBYY FineReader 15新增的智能PDF文档转换功能,借助OCR的精确检测,可有助用户更加准确的将PDF文档转换为可编辑的格式,减少后期格式编辑,文本编辑的繁琐,也可帮助用户获得更为准确的信息与数据,减少反复校对的繁琐,提高工作效率。
想要了解关于ABBYY FineReader 15的更多内容可点击进入ABBYY中文教程中心,查您所需