【文件属性】:
文件名称:chain-vse:我们的CVPR的代码” 18论文“双向检索变得简单”
文件大小:324KB
文件格式:ZIP
更新时间:2021-05-11 20:34:40
Python
双向检索变得简单
用于CVPR“ 18论文的的代码。鉴于我们工作的原始代码无法公开共享,因此我们改编了的代码以提供公开版本。
概述:
概括
用于训练和评估我们新颖的CHAIN-VSE模型以进行有效的多模式检索(图像标注和字幕检索)的代码。 总之,CHAIN-VSE在字符级输入上直接使用卷积层,从而完全替代了RNN和词嵌入的使用。 尽管这些模型更轻巧并且在概念上更简单,但它们在MS COCO和某些文本分类数据集中实现了最新的结果。
强调
独立于词嵌入和RNN
自然适用于多语言场景,而不会因词汇量增加而增加存储要求
输入噪声更强大
更少的参数
简单但有效
双向检索结果
使用此存储库(COCO-1k测试集)并使用预先计算的功能获得的结果(请注意,在此实验中我们不会微调网络):
方法
特征
R @ 1
R @ 10
R @ 1
R @ 10
RFF网[baseline @
【文件预览】:
chain-vse-master
----figures()
--------params.jpeg(94KB)
--------inputnoise.jpeg(130KB)
--------chain.png(174KB)
----code()
--------vocab.py(4KB)
--------file_utils.py(811B)
--------train.py(11KB)
--------evaluation.py(11KB)
--------data.py(18KB)
--------preprocessing.py(3KB)
--------model.py(12KB)
--------text_encoders.py(10KB)
--------layers.py(226B)
--------tokenizers.py(1KB)
--------.gitignore(1KB)
----README.md(5KB)