SCAN:PyTorch“用于图像-文本匹配的堆叠式交叉注意”的源代码(ECCV 2018)

时间:2024-05-23 05:31:28
【文件属性】:

文件名称:SCAN:PyTorch“用于图像-文本匹配的堆叠式交叉注意”的源代码(ECCV 2018)

文件大小:22KB

文件格式:ZIP

更新时间:2024-05-23 05:31:28

computer-vision deep-learning neural-network pytorch image-captioning

介绍 这是Stacking Cross Attention网络,它是Microsoft AI and Research () 源代码。 该论文将出现在ECCV 2018中。该论文建立在PyTorch的之上。 要求和安装 我们建议以下依赖项。 Python 2.7 0.3 (> 1.12.1) 朋克句子分词器: import nltk nltk . download () > d punkt 下载资料 下载数据集文件和预训练的模型。 我们使用产生的。 可以从,和的原始来源下载原始图像。 MS-COCO的预先计算的图像特征从。 从此处使用自下而上的注意力模型从原始Flickr30K图像中提取Flickr30K的预先计算的图像特征。 可以从以下位置下载用于再现论文中的实验所需的所有数据,包括图像特征和词汇表: wget https://iudata.blob.core.windo


【文件预览】:
SCAN-master
----vocab.py(3KB)
----train.py(11KB)
----.gitmodules(127B)
----evaluation.py(13KB)
----bottom-up-attention()
----data.py(4KB)
----model.py(16KB)
----util()
--------convert_data.py(2KB)
----LICENSE(11KB)
----README.md(5KB)
----.gitignore(91B)

网友评论