文件名称:PubLayNet_tfrecords
文件大小:15KB
文件格式:ZIP
更新时间:2024-03-12 01:27:02
Python
PubLayNet_tfrecords 此仓库包含用于将PubLayNet数据集转换为tfrecords进行语义分割的脚本。 tfrecords可用于训练和评估语义分割神经网络,以进行文档结构提取和文档布局识别。 样式和格式 tfrecords的样式和格式与TensorFlow的模型存储库( )上发布的官方语义分割模型相同。 更具体地说,此处发布的脚本遵循用于deeplab的Pascal_VOC数据集的样式和格式。 回购说明 使用代码: 从其官方GitHub存储库( )下载PubLayNet文件。 将train.json和dev.json放在PubLayNet_tfrecords/PubLayNet文件夹下。 解压缩下载的文件,并将每个批次放在PubLayNet_tfrecords/PubLayNet/RawImages/下的相应文件夹中。 在终端中,导航到./PubLayN
【文件预览】:
PubLayNet_tfrecords-master
----build_data.py(5KB)
----LICENSE(1KB)
----README.md(2KB)
----PubLayNet()
--------RawImages()
--------PubLayNet_Playground.ipynb(4KB)
--------SegmentationClass()
----.gitignore(1KB)
----create_PubLayNet_segmentation_mask_png_files.py(5KB)
----build_PubLayNet_tfrecords.py(5KB)