TextGenerator:OCR数据集文本检测数据集字体分类数据集生成器

时间:2024-06-16 20:51:26
【文件属性】:

文件名称:TextGenerator:OCR数据集文本检测数据集字体分类数据集生成器

文件大小:32.96MB

文件格式:ZIP

更新时间:2024-06-16 20:51:26

ocr-dataset-generate text-detect-dataset-generate Python

TextGenerator This is a tools for ocr dataset, text detection, fonts classification dataset generate. 这是一个用来生成ocr数据,文字检测数据,字体识别的最方便的工具 实现的功能: 生成基于不同语料的,不同字体、字号、颜色、旋转角度的文字贴图 支持多进程快速生成 文字贴图按照指定的布局模式填充到布局块中 在图像中寻找平滑区域当作布局块 支持文字区域的图块抠取导出(导出json文件,txt文件和图片文件,可生成voc数据,ICDAR_LSVT数据集格式!) 支持每个文字级别的标注(存入了lsvt的json文件中) 支持用户自己配置各项生成配(图像读取,生成路径,各种概率) 效果预览 生成图片示例: 文字贴图示例: 旋转矩形示例 单个文字包围框示例 使用方式 环境安装(Python3.6+,建


【文件预览】:
TextGenerator-master
----core()
--------__init__.py(0B)
--------element()
--------layout()
----img()
--------fragment_6fc1b6ac180755dea3dfe711550251708b5e2ce519.jpg(4KB)
--------pic_7f6cb78368edaf8347a8f0ce7e5a46c2df4f3ddd.jpg(211KB)
--------fragment_ca71322eec0332fb3f6bb2a213c22f4a183c69da7.jpg(17KB)
--------fragment_178b7da018e0d84c80b1455be4cc099bc68a07271.jpg(29KB)
--------char_box.png(2.46MB)
--------fragment_f712bd7187d446b5fd5daf0ee0c6cb33ad26f98710.jpg(13KB)
--------rotate_rect.png(1.8MB)
----constant.py(824B)
----assets()
--------img()
--------font()
--------corpus()
----LICENSE(1KB)
----run.py(137B)
----config.yml(3KB)
----requirements.txt(60B)
----.gitignore(4KB)
----service()
--------provider()
--------__init__.py(2KB)
--------base.py(8KB)
----README.md(2KB)
----utils()
--------time_util.py(194B)
--------font_tool.py(525B)
--------__init__.py(78B)
--------decorator.py(838B)
--------random_tools.py(2KB)
--------log.py(47B)
----make.sh(133B)
----libs()
--------cxx()
--------__init__.py(372B)

网友评论