matlab改变代码字体-FontFreeOCR:FontFreeOCR

时间:2024-06-12 11:01:51
【文件属性】:

文件名称:matlab改变代码字体-FontFreeOCR:FontFreeOCR

文件大小:231KB

文件格式:ZIP

更新时间:2024-06-12 11:01:51

系统开源

matlab更改代码字体无字体OCR 该项目试图在MATLAB中实现无字体OCR算法。 它大致基于Kae&Learned-Miller(1)的工作。 进行了修改,以简化算法,语言模型并减少计算时间。 它是麻省大学阿默斯特分校CS 670(研究生计算机视觉)的最终项目。 该算法将每行堆叠一个单词的单词图像作为输入,并返回代表图像中文本的字符串。 它通过相互比较字符,创建匹配的字符集以及将每个字符集的基数与期望的字母频率进行比较来实现此目的。 用简单的英语来说,这意味着程序假定匹配字符的最大集合是包含每个“ E”的集合,第二大字符包含每个“ A”,依此类推。 简而言之,该项目是尝试使用互信息(用于图像对齐)和英语的非常基本的模式来转录文本。 coded.m-> decodeText(words)-这是程序的入口点。 您无需提供参数。 如果您在运行时未对源进行任何更改,它将产生相当不错的文本翻译,但这使用的是修改后的英文字符分布。 要使用“真实”分布(也就是说,从非常大量的现代文本样本中收集的字母频率),请注释掉cryptoText.m的第125行,并取消注释第118-124行。 您会发现输


【文件预览】:
FontFreeOCR-master
----getMeanGlyph.m(362B)
----splitImage.m(516B)
----mutualInformationBetweenCharacters.m(776B)
----shatterBlobs.m(284B)
----translateInputImage.m(613B)
----splitWord.m(231B)
----declaration.png(242KB)
----decodeText.m(14KB)
----convertListToBlobs.m(937B)
----computeMeanGlyph.m(309B)
----sortWords.m(408B)
----translateImage.m(671B)
----mutInfo.m(590B)
----README.md(3KB)
----splitTextImage.m(322B)
----printMatchedSets.m(259B)
----discreteEntropy.m(859B)

网友评论