文件名称:SCANProject:堆叠式交叉注意项目页面
文件大小:1.73MB
文件格式:ZIP
更新时间:2024-05-20 15:16:41
1,1,1,厚东胡1,2 * 1个Microsoft AI和研究, 2个JD AI研究(*在Microsoft工作时执行的工作) 这是来自Microsoft AI&Research的Stacked Cross Attention Network(SCAN)的项目页面。 Stacked Cross Attention是一种通过推断潜在的语言视觉对齐方式来进行图像-文本跨模式匹配的注意机制。 这项工作将出现在ECCV 2018中。 抽象的 在本文中,我们研究了图像-文本匹配的问题。 推断对象或其他重要材料(例如雪,天空,草坪)和句子中相应单词之间的潜在语义对齐方式,可以捕获视觉和语言之间的细微相互作用,并使图像-文本匹配更具可解释性。 先前的工作要么简单地汇总了所有可能的区域和单词对的相似性,而没有差别地关注越来越少的重要单词或区域,要么使用多步骤注意过程来捕获有限数量的难以解释的语义对齐方
【文件预览】:
SCANProject-master
----.DS_Store(8KB)
----_config.yml(56B)
----README.md(4KB)
----docs()
--------figs()
--------.DS_Store(8KB)