文件名称:Arabic-OCR:用于阿拉伯语的OCR系统,可将键入文本的图像转换为机器编码的文本
文件大小:10.89MB
文件格式:ZIP
更新时间:2024-06-05 17:06:52
machine-learning ocr neural-network image-processing dataset
阿拉伯语OCR 用于阿拉伯语的OCR系统,可将键入文本的图像转换为机器编码的文本。 系统当前仅支持字母(29个字母)ا-ى,لا。 该系统旨在解决仅包含阿拉伯字符的图像的OCR问题(请检查下面的数据集链接以查看图像样本)。 设置 安装python然后运行以下命令: pip install -r requirements.txt 跑步 将图像放在src / test目录中 转到src目录并运行以下命令python OCR.py 将使用以下命令创建输出文件夹: 文本文件夹,其中包含与图像相对应的文本文件。 running_time文件,其中包含处理每个图像所需的时间。 管道 数据集 链接到图像和相应文本的数据集:。 我们使用了1000张图像来生成用于训练的角色数据集。 例子 线段 分词 字符分割 测验 注意:请确保您有一个包含真值输出的文件夹,且其文件名相同,以将其与预测
【文件预览】:
Arabic-OCR-master
----LICENSE(1KB)
----src()
--------models()
--------preprocessing.py(3KB)
--------OCR.py(3KB)
--------utilities.py(460B)
--------train.py(5KB)
--------test()
--------dataset.py(3KB)
--------segmentation.py(3KB)
--------output()
--------character_segmentation.py(20KB)
--------feature_extraction.py(7KB)
--------edit.py(782B)
--------truth()
----requirements.txt(726B)
----.gitignore(49B)
----README.md(2KB)
----Figures()
--------pipeline.PNG(40KB)
--------char4.png(136B)
--------word.png(177B)
--------char1.png(102B)
--------line.png(1KB)
--------char2.png(107B)
--------char3.png(99B)
--------test.png(2KB)
----Dataset()
--------char_4K_sample.rar(20.36MB)