文件名称:banti_telugu_ocr:泰卢固语的端到端OCR系统。 基于卷积神经网络
文件大小:7.92MB
文件格式:ZIP
更新时间:2024-03-31 16:10:11
系统开源
全面的泰卢固语OCR系统 Banti框架 该框架依赖于分割算法将文本分解为字形的能力。 因此,它可以扩展到具有良好分离图像的其他脚本,例如马拉雅拉姆语,奥里亚语,泰米尔语,卡纳达语,泰语等。 特征 打开由antanci_segmenter生成的框文件 将它们传递给训练的神经网络 语言的n-gram建模 能够处理损坏的字形(使用语言模型)。 依存关系 Python3 脾气暴躁,鼻涕,鼻子等 枕头 安装说明 使用Docker映像 最简单的方法是从pull预构建的映像并在容器中run 。 您可以使用以下命令执行此操作。 docker pull chprasad/banti_telugu_ocr:20160310 docker run -it chprasad/banti_telugu_ocr:20160310 /bin/bash 如果您的机器上没有Docker,则可以首先使用文档中的限制
【文件预览】:
banti_telugu_ocr-master
----Dockerfile(561B)
----requirements.txt(111B)
----library()
--------nn.pkl(21B)
--------4hidaux_252611_01.pkl(4.39MB)
--------mega.123.pkl(9.86MB)
--------4hidaux_252611.txt(8KB)
----banti()
--------classifier.py(2KB)
--------scaler()
--------dewarp.py(8KB)
--------ngramgraph.py(4KB)
--------__init__.py(0B)
--------post_process.py(2KB)
--------iast_unicodes.py(16KB)
--------page.py(15KB)
--------proglyph.py(4KB)
--------conncomp.py(2KB)
--------ocr.py(3KB)
--------basicglyph.py(1KB)
--------linegraph.py(5KB)
--------processedpage.py(2KB)
--------glyph.py(5KB)
--------ngram.py(1KB)
--------helpers.py(2KB)
----LICENSE(11KB)
----sample_images()
--------praasa.box(179KB)
--------praasa.txt(2KB)
--------praasa.tif(43KB)
----scalings()
--------absolute09.scl(338B)
--------relative32.scl(207B)
--------absolute68.scl(405B)
--------relative48.scl(210B)
----scripts()
--------build_123grams.py(4KB)
--------skew_correct.ipynb(317KB)
--------classify_training_data.py(8KB)
--------tile.py(1KB)
--------text2glyphs.py(4KB)
--------classify_paint.py(4KB)
--------gen_training_data.py(7KB)
----README.md(3KB)
----tests()
--------Run these tests from one directory above.(0B)
--------processed_page_test.py(566B)
--------classifier_test.py(977B)
--------glyph_test.py(613B)
--------iast_unicodes_test.py(269B)
--------dewarp_test.py(597B)
--------ngram_test.py(2KB)
--------page_test.py(238B)
--------ngramgraph_test.py(1KB)
--------linegraph_test.py(691B)
----recognize.py(5KB)
----labellings()
--------alphacodes.lbl(6KB)
--------mallicodes.lbl(5KB)
--------numbers09.lbl(93B)