文件名称:CRNN:卷积递归神经网络用于Keras中的场景文本识别或OCR
文件大小:59KB
文件格式:ZIP
更新时间:2024-06-04 09:30:06
ocr keras text-recognition scene-text scene-text-recognition
神经网络 卷积神经网络的Keras文本识别实现 此实现中有两种可用的模型。 一个基于原始CRNN模型,另一个则包含空间转换器网络层以纠正文本。 但是,性能差别不大,因此由您决定选择哪种型号。 训练 您可以使用Synth90k数据集训练模型,但也可以使用自己的数据。 如果使用自己的数据,则必须重写代码,以便根据数据结构来加载数据。 要下载Synth90k数据集,请转到此并下载MJSynth数据集。 可以将Synth90k数据集放在data/Synth90k或者使用--base_dir参数指定数据集的路径。 基本目录应包括许多包含Synth90k数据的子目录,用于训练,验证和测试数据的注释文件,列出数据集中所有图像的路径的文件以及词典文件。 使用--model参数指定要使用的两个可用模型中的哪个。 默认模型是带有STN层的CRNN。 有关详细信息,请参见config.py 。 运行tra
【文件预览】:
CRNN-master
----.gitignore(47B)
----STN()
--------spatial_transformer.py(7KB)
--------mnist_cluttered_example.ipynb(72KB)
----eval.py(4KB)
----LICENSE(1KB)
----models.py(7KB)
----utils.py(8KB)
----data_generator.py(5KB)
----README.md(2KB)
----config.py(2KB)
----.gitattributes(24B)
----train.py(5KB)