irlc-vqa-counting:用于ICLR 2018再现性挑战的视觉问题解答的可解释计数代码

时间:2024-05-29 20:01:19
【文件属性】:

文件名称:irlc-vqa-counting:用于ICLR 2018再现性挑战的视觉问题解答的可解释计数代码

文件大小:3.03MB

文件格式:ZIP

更新时间:2024-05-29 20:01:19

JupyterNotebook

irlc-vqa 用于ICLR 2018再现性挑战的的可解释代码。 关于 本文改进了VQA中基于问题的计数的最新准确性。 他们通过强制执行先验,即每个计数对应于图像中定义良好的区域,并且不会在整个区域上扩散。 他们通过将图像与问题信息融合在一起,对图像中的一组固定候选区域(来自预先训练的Faster-R-CNN网络)进行硬参与。 他们使用REINFORCE的一种变体-自我批判训练-非常适合生成序列。 我发现这篇论文很有趣。 由于找不到本文的任何公开可用的实现,因此我决定将其作为一种自我实现来实现。 结果(不带字幕接地) 软计数 模型 测试精度 测试RMSE 训练时间 已报告 49.2 2.45 未知 这个实现 49.7 2.31 〜12分钟(Nvidia-1080 Ti) 红外光谱仪 模型 测试精度 测试RMSE 训练时间 已报告 56.1 2.45 未知 这个实现 5


【文件预览】:
irlc-vqa-counting-master
----config.py(52B)
----model.py(17KB)
----Visualize IRLC.ipynb(1.98MB)
----dataset.py(7KB)
----vis()
--------01-selection_image-364.png(126KB)
--------03-selection_image-335.png(134KB)
--------image_candidates-335.png(106KB)
--------image_candidates-364.png(97KB)
--------orig_image-364.png(126KB)
--------00-selection_image-364.png(126KB)
--------02-selection_image-335.png(134KB)
--------01-selection_image-335.png(135KB)
--------00-selection_image-335.png(135KB)
--------orig_image-335.png(135KB)
--------04-selection_image-335.png(134KB)
--------02-selection_image-364.png(126KB)
----LICENSE(1KB)
----tools()
--------process_hmqa.sh(42B)
--------download_hmqa.sh(657B)
--------create_dictionary.py(2KB)
--------process.sh(129B)
--------detection_features_converter.py(5KB)
--------download.sh(1KB)
--------create_how_many_qa_dataset.py(10KB)
--------compute_softscore.py(9KB)
----Training IRLC.ipynb(125KB)
----README.md(7KB)
----Training SoftCount.ipynb(35KB)
----.gitignore(1KB)

网友评论