【文件属性】:
文件名称:DegradedOCR:基于CNN BLSTM CTC的Bangla降级OCR线路识别实现
文件大小:10.32MB
文件格式:ZIP
更新时间:2021-05-14 17:47:57
Python
降级孟加拉文档的OCR
基于CNN BLSTM CTC的Bangla降级OCR线识别实现。 这项工作在被接受为会议论文
特征
拍摄灰度/二值化线图像
无需特征提取
针对每个线条图像生成Unicode输出
要求
该模型是使用以下方式实现的
Python 2.7(保持此版本)
Tensorflow 1.6+
H5py
枕头
脾气暴躁的
使用说明
从PrepareDataset.py运行功能makeh5_from_dir() 。 这将针对指定的图像文件夹创建一个HDF文件,例如,“数据/样本/火车/ Line_Images” 。为Train和Test目录seperatley运行此文件。您需要2个HDF文件。
如图所示实现了基于CNN BLSTM CTC的网络:
该网络在Hybrid_Model_Degraded.py中给出。 运行注释中指定的main()方法。
在Predict模式