文件名称:handwriting-ocr:用于识别手写文本的OCR软件
文件大小:36.22MB
文件格式:ZIP
更新时间:2024-02-27 02:36:42
python opencv machine-learning ocr handwriting-ocr
手写OCR 该项目试图创建用于识别照片中手写文字的软件(也适用于捷克语)。 它使用计算机视觉和机器学习。 并针对该问题尝试了不同的方法。 它最初是一个学校项目,我有机会在Intel ISEF 2018上进行了介绍。 程序结构 识别过程分为4个步骤。 初始输入是带有文字的页面照片。 检测页面并清除背景 单词的检测和分离 单词标准化 字符的分离和识别(单词的识别) 包含所有步骤的主文件是或 。 文件命名分步表示-机器学习模型的名称。 入门 1.克隆存储库 git clone https://github.com/Breta01/handwriting-ocr.git 下载仓库后,您必须下载数
【文件预览】:
handwriting-ocr-master
----.gitattributes(0B)
----notebooks()
--------page_detection.ipynb(1.09MB)
--------OCR.ipynb(1.83MB)
--------ocr_evaluator.ipynb(19KB)
--------word_preprocessing.ipynb(177KB)
--------word_detection.ipynb(1.07MB)
----models()
--------freeze_graph.py(11KB)
--------README.md(323B)
--------graph_optimizer.py(3KB)
----char_classifier_RNN.ipynb(102KB)
----char_segmentation.ipynb(931KB)
----src()
--------__init__.py(0B)
--------data()
--------ocr()
----Dockerfile(145B)
----char_classifier_CNN.ipynb(15KB)
----char_segmentation_experimental.ipynb(873KB)
----doc()
--------imgs()
----LICENSE(1KB)
----char_segmentation_BiRNN.ipynb(117KB)
----word_classifier_seq2seq.ipynb(118KB)
----environment.yml(2KB)
----README.md(2KB)
----data()
--------pages()
--------raw()
--------dictionaries()
--------characters()
--------README.md(4KB)
----word_classifier_seq2seqX.ipynb(360KB)
----.gitignore(1KB)
----char_segmentation_CNN.ipynb(94KB)
----word_classifier_CTC.ipynb(18KB)