文件名称:SimpleHTR:使用TensorFlow实现的手写文本识别(HTR)系统
文件大小:512KB
文件格式:ZIP
更新时间:2024-02-23 23:45:49
machine-learning ocr deep-learning tensorflow recurrent-neural-networks
使用TensorFlow进行手写文本识别 2021年更新:更强大的模型,更快的数据加载器,仅Python3 2020年更新:代码与TF2兼容 使用TensorFlow(TF)实现并在IAM离线HTR数据集上接受训练的手写文本识别(HTR)系统。 这种神经网络(NN)模型可识别分段词图像中包含的文本,如下图所示。 正确识别了验证集中的3/4个单词,字符错误率约为11%。 运行演示 IAM数据集上训练。 将下载的文件model.zip的内容放入存储库的model目录中。 然后,转到src目录并运行python main.py 输入图像和预期输出如下所示。 > python main.py Validation character error rate of saved model: 11.118344571029994% Init with stored values from ../model/snapshot-76 Recognized: "Hello" Probability: 0.8462573289871216 经过测试: Python 2(commit <= 97c251
【文件预览】:
SimpleHTR-master
----src()
--------main.py(6KB)
--------analyze.py(5KB)
--------DataLoaderIAM.py(5KB)
--------SamplePreprocessor.py(2KB)
--------Model.py(12KB)
--------createLMDB.py(768B)
----model()
--------accuracy.txt(66B)
--------charList.txt(79B)
--------wordCharList.txt(54B)
----requirements.txt(118B)
----doc()
--------analyze.png(61KB)
--------graphics.svg(180KB)
--------decoder_comparison.png(31KB)
--------nn_overview.png(63KB)
--------htr.png(12KB)
----LICENSE.md(1KB)
----README.md(10KB)
----data()
--------analyze.png(4KB)
--------translationInvarianceTexts.pickle(294B)
--------corpus.txt(577KB)
--------test.png(20KB)
--------pixelRelevance.npy(13KB)
--------translationInvariance.npy(192B)
----.gitignore(108B)