cs147_vqa:CS147的VQA项目

时间:2024-03-18 07:06:13
【文件属性】:

文件名称:cs147_vqa:CS147的VQA项目

文件大小:6KB

文件格式:ZIP

更新时间:2024-03-18 07:06:13

Python

cs147_vqa CS147的VQA项目 该存储库旨在解决视觉问题解答任务。 当前功能仅限于多项选择题。 如何运行我们的模型: 使用图像预处理运行:如果这是您第一次运行我们的模型,则可能没有将图像提取为特征。 在这种情况下,您可能希望在使用ImageNet上预训练的VGG-19网络提取图像特征时训练模型。 确保配置了正确的文件路径,然后运行以下命令: ../data/annotations/mscoco_train2014_annotations.json ../data/questions/MultipleChoice_mscoco_train2014_questions.json cd code python ./vqa.py -i 无需图像预处理即可运行:如果这不是您第一次运行模型,并且您已经在名为“ weights_features”的文件夹中提取了图像特征,则可以


【文件预览】:
cs147_vqa-main
----.gitignore(42B)
----code()
--------vqa.py(8KB)
--------preprocess.py(5KB)
----README.md(994B)

网友评论