文件名称:OCR:使用深度学习进行光学字符识别
文件大小:182KB
文件格式:ZIP
更新时间:2024-06-01 08:39:25
tensorflow cnn lstm tensorflow-experiments deeplearning
使用DeepLearning进行光学字符识别 文字无处不在! 它存在于PDF,文档和图像中。 在许多应用程序中,文本数据可用于进行分析。 这样的应用包括收据识别,车牌检测,从图像中提取乳胶配方等。通用计算机视觉可以用于此类任务,但缺乏准确性。 为了解决低精度和方差问题,我们使用了最先进的深度神经网络。 该存储库包括: 1. A TensorFlow implementation of the CNN+LSTM+CTC model for OCR. 2. supporting scripts to apply the RCNN appraoch for OCR. 建筑学 有关如何运行的说明 获取仓库 git clone https://github.com/harshul1610/OCR.git 获取NIST19数据集 mkdir data wget https://s3.amazo
【文件预览】:
OCR-master
----.ipynb_checkpoints()
--------LSTM_CTC_OCR-captcha-checkpoint.ipynb(31KB)
--------Combine_Images_annotations_data-checkpoint.ipynb(6KB)
--------ocr_classification-checkpoint.ipynb(41KB)
--------LSTM_CTC_OCR-checkpoint.ipynb(37KB)
--------CNN_LSTM_CTC_OCR-captcha-checkpoint.ipynb(30KB)
--------make_annotations-checkpoint.ipynb(36KB)
--------make_pbtxt-checkpoint.ipynb(2KB)
----ocr_classification.ipynb(41KB)
----label_cls_name.json(860B)
----generate_captcha.py(710B)
----make_pbtxt.ipynb(2KB)
----images()
--------cnn_lstm_Architecture.jpeg(50KB)
----LSTM_CTC_OCR-captcha.ipynb(31KB)
----generate_tfrecord.py(4KB)
----xml_to_csv.py(1KB)
----LICENSE(1KB)
----captcha(14KB)
----README.md(1KB)
----make_annotations.ipynb(36KB)
----CNN_LSTM_CTC_OCR-captcha.ipynb(30KB)
----LSTM_CTC_OCR.ipynb(37KB)
----Combine_Images_annotations_data.ipynb(6KB)
----.gitignore(16B)