matlab插值代码解释-Taan:OCR和旧文件的翻译

时间:2024-06-15 14:34:09
【文件属性】:

文件名称:matlab插值代码解释-Taan:OCR和旧文件的翻译

文件大小:4.99MB

文件格式:ZIP

更新时间:2024-06-15 14:34:09

系统开源

matlab插值代码解释'安 该项目旨在轻松识别旧作品中的字符并将其自动翻译为任何其他语言。 用法 python img2txt.py <input_file> 要求 T'aan使用Google的OCR执行OCR。 下载它或从GitHub的存储库中克隆它。 按照您的相应OS进行操作。 最新版本已包含识别最常见的书写系统和语言的模型。 该模块是的包装器,需要将给定的PDF转换为图像,然后使用Tesseract。 参考 在线的 。 凯瑟琳·马斯登(Katherine Marsden)创建的OCR软件包,1996年从伯克利大学计算机科学专业毕业。 。 基于特征点检测字符的一种古老而有趣的方法,该方法是由东北大学的Eric W. Brown在1992年创建的。 。 Vijay Rajan Nadar使用像素计数和相对位置简短描述了一个简单的OCR。 。 使用MATLAB检测图像中包含文本的区域的示例。 。 Andrew Kirillow的文章中介绍了有关使用神经网络进行光学字符识别的一些想法。 2005年。 。 卷积神经网络的一个示例,旨在通过最少的预处理直接从像素


【文件预览】:
Taan-master
----pdf2txt.py(451B)
----findText.m(2KB)
----findText.py(1KB)
----page001.png(431KB)
----img2txt.py(811B)
----outfile.png(40KB)
----truth_page001.txt(1KB)
----TextPage001.txt(1KB)
----README.md(6KB)
----page001.txt(976B)
----.gitignore(99B)
----Tinosos_-_Fernandez_de_Lizardi.pdf(4.73MB)

网友评论