【文件属性】:
文件名称:densecap-pytorch:密集帽的简化pytorch版本
文件大小:3.08MB
文件格式:ZIP
更新时间:2021-03-08 11:06:03
皮尔托奇的Densecap
简化pytorch版本
发出或直接通过与我联系
什么是密集帽?
从图像中检测区域,并用简短的句子描述每个区域。
参见或
那这个实现呢?
事情是最新的:Python 3.7和pytorch 1.4.0
我们的模型代码直接从继承了GeneralizedRCNN,并试图使其易于理解和使用(希望如此)。 因此,区域检测器部分与原始纸张不同。
应该可以在具有12GB内存的单个GTX 1080Ti GPU上进行训练。
要求
的Python 3.7
pytorch 1.4.0
火炬视觉0.5.0
麻木
皮尔
h5py
tqdm
张量板
DataLoader的预取版本: :
顶点: : (以加快培训速度)
nlgeval *: :
注意:我们使用nlgeval来计算Meteor,您可以修改validate.py以使用其他方法,例如coco-
【文件预览】:
densecap-pytorch-main
----vg_dataset_visualization.ipynb(1.31MB)
----.gitignore(2KB)
----detection_utils()
--------README.md(975B)
--------coco_utils.py(9KB)
--------train.py(8KB)
--------group_by_aspect_ratio.py(7KB)
--------coco_eval.py(12KB)
--------utils.py(10KB)
--------__init__.py(287B)
--------engine.py(4KB)
--------transforms.py(1KB)
----README.md(5KB)
----utils()
--------data_loader.py(6KB)
--------__init__.py(0B)
----visual_genome_python_driver()
----.gitmodules(150B)
----dataset.py(3KB)
----train.py(8KB)
----pics()
--------example.png(1.83MB)
----describe.py(8KB)
----evaluate.py(3KB)
----model()
--------densecap.py(7KB)
--------evaluator.py(8KB)
--------__init__.py(0B)
--------roi_heads.py(15KB)
--------box_describer.py(5KB)
----preprocess.py(17KB)
----info()
--------densecap_splits.json(764KB)