文件名称:dataset-generator-for-ocr:使用MNIST数据集中的图像为OCR系统创建训练数据集
文件大小:1.06MB
文件格式:ZIP
更新时间:2024-03-13 10:39:15
Python
OCR系统的数据集生成器 使用MNIST数据库中的手写数字图像为OCR系统生成训练数据集。 用法 检查是否配置了Python环境: $ python3 --version $ pip3 --version $ virtualenv --version 如果未安装软件包,请安装它们: $ sudo apt update $ sudo apt install python3-dev python3-pip $ sudo pip3 install -U virtualenv 将存储库克隆到本地计算机后,创建一个虚拟环境: $ cd ./dataset-generator-for-ocr $ virtualenv ./myvenv 激活虚拟环境: $ source ./myvenv/bin/activate 然后我们可以配置环境: (myvenv) $ pip install --up
【文件预览】:
dataset-generator-for-ocr-master
----main.py(2KB)
----requirements.txt(460B)
----dataset_gen.py(2KB)
----img_gen.py(3KB)
----README.md(3KB)
----data()
--------lable_len6.csv(350B)
--------lable_12345.csv(6KB)
--------train_len6.csv(583KB)
--------train_12345.csv(9.13MB)