文件名称:image_captioning:PyTorch中的图像字幕模型
文件大小:590KB
文件格式:ZIP
更新时间:2024-06-15 11:06:20
JupyterNotebook
PyTorch中的图像字幕模型 一些代码是从借来的 这是Google-NIC [3],soft-attention [2]和SCA-CNN [1]与PyTorch和Python3的实现。 对于SCA-CNN,我没有时间实现多层关注,因此我仅将resnet152的最后一层的输出用作图像特征。 (我将继续实施完整的SCA-CNN。) 用法: 下载存储库: # download and follow the setup steps in coco-caption-py3.git/README.md $ git clone https://github.com/stevehuanghe/coco-caption-py3.git # download this respository $ git clone https://github.com/stevehuanghe/image_capti
【文件预览】:
image_captioning-master
----.gitignore(1KB)
----download.sh(471B)
----train_ssa.sh(80B)
----README.md(4KB)
----utils()
--------config.py(3KB)
--------logger.py(1KB)
--------vocabulary.py(550B)
--------data_loader.py(6KB)
--------__init__.py(0B)
----train_nic.sh(72B)
----test.py(5KB)
----train.py(6KB)
----build_vocab.py(2KB)
----LICENSE(11KB)
----train_scacnn.sh(83B)
----evaluate.py(1KB)
----models()
--------ssa.py(9KB)
--------scacnn.py(12KB)
--------critique.py(8KB)
--------__init__.py(0B)
--------nic.py(8KB)
----visualize_caption.ipynb(751KB)
----requirements.txt(60B)
----test_nic.sh(111B)
----test_ssa.sh(112B)