文件名称:artificial_manga_panel_dataset
文件大小:15KB
文件格式:ZIP
更新时间:2024-04-27 09:29:06
kaggle dataset japanese-fonts manga-panels Python
人造漫画面板数据集-AMP-D 此仓库中有什么? 该存储库包含关联的文件和链接,以创建人造漫画面板数据集 目前的进展: 脚步: 查找相关的日语对话数据集 查找喜欢日文字体的漫画 查找其他文本气泡类型 查找漫画图像或其他黑白图像以用于填充面板 创建一些漫画页面布局模板 结合以上元素创建漫画面板 创建字体转换 用漫画面板生成器替换布局模板 将数据集上传到Kaggle 数据种类 196种字体,字符覆盖率> 80% 728种气泡类型(182种未转换) 日文和英文的2,801,388句子对 该数据集是如何制作的? 下载了JESC数据集以获取句子对 从下面提到的字体网站中找到的字体 从Kaggle下载了Tagged Anime Illustrations数据集 找到并创建了不同类型的泡泡 验证哪些字体可行,并且可以覆盖JESC数据集中至少80%的字符 将所有图像转换成黑白图
【文件预览】:
artificial_manga_panel_dataset-main
----.gitignore(2KB)
----requirements.txt(77B)
----preprocesing()
--------extract_and_verify_fonts.py(4KB)
--------text_dataset_format_changer.py(466B)
--------convert_images.py(1KB)
----README.md(4KB)
----datasets.dvc(104B)
----scraping()
--------download_texts.py(2KB)
--------download_fonts.py(2KB)
--------font_download_manual.ipynb(1KB)
----.dvcignore(139B)
----main.py(699B)
----.dvc()
--------.gitignore(26B)
--------config(102B)
--------plots()