文件名称:ocrevalUAtion:阿利坎特大学为您带来的OCR评估
文件大小:19.89MB
文件格式:ZIP
更新时间:2024-05-23 17:30:00
HTML
手术 这组类提供了对两个文本文件进行比较的基本支持:一个参考文件(一个真实的文档)和一个OCR引擎的输出(一个文本文件)。 特定行为的选项包括:忽略大小写,忽略变音符号,忽略标点符号,忽略停用词,Unicode和用户定义的字符之间的等效项。 除命令行界面用法外,它还可与提供的图形用户界面(GUI)一起使用。 支持的输入格式包括:纯文本,FineReader 10 XML,PAGE XML,ALTO XML和hOCR HTML。 输出会生成一个带有统计信息(包括CER和WER错误率)的报告,以及一个带有并行输入文本的表格,其中突出显示了差异。 有关OCR评估和此工具的详尽介绍,请访问 您可以从下载最新版本。 有关如何使用ocrevalUAtion的说明,请参见 。