文件名称:DFOL-VQA:视觉问答的微分一阶逻辑推理
文件大小:1.18MB
文件格式:ZIP
更新时间:2024-06-08 18:56:51
Python
视觉问答的微分一阶逻辑推理 可区分的一阶逻辑推理框架(称为∇-FOL )是一种视觉符号回答(VQA)的神经符号体系结构,其基础是将有关视觉场景的问题公式化为一阶逻辑(FOL)公式。 有关更多技术细节,请参阅我们的论文: 赛义德·阿米扎德(Saeed Amizadeh),哈米德·帕兰吉(Hamid Palangi),亚历克斯·波洛佐夫(Alex Polozov),黄震辰和小和一夫一郎(Kazuhito Koishida),《神经符号视觉推理:从“推理”中脱颖而出》 ,在第37届国际机器学习会议(ICML)会议录中,第10696--10707页,维也纳,奥地利,2020年。 如果您出于任何研究/出版目的使用此代码,请确保引用我们的论文: @incollection{dfol_vqa_icml2020, author = {Amizadeh, Saeed and Pala
【文件预览】:
DFOL-VQA-main
----config()
--------sample_config.yaml(2KB)
--------curriculum_training()
----CONFIG_YAML.md(5KB)
----framework.png(375KB)
----SECURITY.md(3KB)
----LICENSE(1KB)
----.DS_Store(6KB)
----src()
--------.DS_Store(6KB)
--------gqa_interpreter_experiments.py(16KB)
--------gqa_preprocess.py(16KB)
--------nsvqa()
----setup.py(2KB)
----.gitignore(6KB)
----CODE_OF_CONDUCT.md(444B)
----README.md(13KB)