CRNN_Mxnet:MXnet版本的CRNN,用于使用CNN + 2层BLSTM + CTC体系结构进行场景文本识别

时间:2021-05-11 14:00:58
【文件属性】:
文件名称:CRNN_Mxnet:MXnet版本的CRNN,用于使用CNN + 2层BLSTM + CTC体系结构进行场景文本识别
文件大小:403KB
文件格式:ZIP
更新时间:2021-05-11 14:00:58
Python CRNN_MXnet 此存储库包含卷积循环神经网络(CRNN)的MXnet版本,用于场景文本识别。 在“基于图像的序列识别的端到端可训练神经网络及其在场景文本识别中的应用”中提出了CRNN。 论文链接: : 火炬原始版本: : 该存储库的体系结构是:ResNet-34、2层BLSTM和CTC。 为了降低LSTM成本并解决文本长度可变的问题,应用了Bucketing。 Mxnet版本 使用contrib程序包中的Mxnet CTC损失层,在MXnet 0.10.0中添加了CTCLoss。 因此,MXnet版本必须> = 0.10.0。 我使用0.10.1,它的工作原理。 训练 1.将自己的数据集放到egicdar2013文件夹中 2.将文本标签放入txt文件,例如icdar2013_gt.txt,其内容应如下,图像名称和标签应用空白分隔。 word_1 . png prop
【文件预览】:
CRNN_Mxnet-master
----predict.py(5KB)
----text_bucketing_iter.py(7KB)
----README.md(2KB)
----text_deep_ocr_bucketing_resume.py(4KB)
----idx2char.json(547B)
----resnet.py(8KB)
----make_train_list.py(2KB)
----.gitattributes(153B)
----model()
--------ic13-0001.params(134B)
--------.gitattributes(45B)
--------ic13-symbol.json(214KB)
----test.png(360KB)
----char2idx.json(399B)
----valid.lst(5KB)
----text_lstm.py(9KB)
----text_deep_ocr_bucketing.py(4KB)
----gt.txt(15KB)
----train.lst(49KB)

网友评论