文件名称:PICK-pytorch:论文代码“ PICK
文件大小:17.4MB
文件格式:ZIP
更新时间:2024-04-08 05:16:59
document-analysis graph-convolutional-network graph-learning graph-neural-networks document-understanding
派克火炬 ***** 2021年2月6日更新:火车票数据集现已可用于学术研究。您可以从或下载。它包含1,530张合成图像和320张用于训练的真实图像,以及80张用于测试的真实图像。有关如何从采样训练/测试集并生成相应注释的更多详细信息,请参阅我们的。***** *****于2020年9月17日更新:现已提供有关大规模文档理解数据集训练示例。请参阅以获取更多详细信息。感谢贡献。***** PyTorch重新实现 (ICPR 2020)。该项目与我们最初的实现不同。 内容 介绍 通过将图学习与图卷积操作相结合,PICK是一个有效且强大的框架,可处理关键信息提取(KIE)的复杂文档布局,从而产生更丰富的语义表示,其中包含文本和视觉特征以及全局布局而不会产生歧义。所示的总体架构如下。 要求 Python= 3.6 火炬视觉= 0.6.1 表格= 0.8.7 覆盖= 3.0.0 opencv_
【文件预览】:
PICK-pytorch-master
----data_utils()
--------pick_dataset.py(12KB)
--------__init__.py(80B)
--------documents.py(20KB)
----.gitignore(1KB)
----requirements.txt(163B)
----data()
--------test_data_example()
--------README.md(1KB)
--------data_examples_root()
----model()
--------__init__.py(80B)
--------pick.py(6KB)
--------graph.py(9KB)
--------crf.py(17KB)
--------decoder.py(8KB)
--------resnet.py(7KB)
--------encoder.py(7KB)
----assets()
--------overall.png(101KB)
--------example.png(655KB)
----LICENSE(1KB)
----dist_train_with_params.sh(136B)
----utils()
--------__init__.py(45B)
--------keys.txt(18KB)
--------metrics.py(2KB)
--------util.py(4KB)
--------entities_list.py(344B)
--------class_utils.py(2KB)
--------span_based_f1.py(14KB)
----examples()
--------DocBank()
--------utils.py(8KB)
----dist_train.sh(193B)
----trainer()
--------trainer.py(21KB)
--------__init__.py(103B)
----README.md(9KB)
----tests()
--------__init__.py(80B)
--------test.py(6KB)
----test.py(5KB)
----logger()
--------visualization.py(3KB)
--------__init__.py(75B)
--------logger.py(794B)
--------logger_config.json(993B)
----.flake8(88B)
----parse_config.py(7KB)
----config.json(4KB)
----train.py(7KB)