文件名称:vqa:视觉问答
文件大小:1.78MB
文件格式:ZIP
更新时间:2024-03-08 01:14:10
Python
VQA
视觉问答
运行代码
该模型基于在运行代码之前,请从下载相关的训练,验证和测试数据。下面的部分根据需要Resnet-18或CNN的结果告诉您要运行哪些脚本
有线电视新闻网
我们按照以下顺序运行脚本以获得最佳结果
image_preprocessing_CNN.py
这将从图像中提取特征
preprocess-QA.py
这从提出的问题中提取特征
train_models_cnn.py
这使用L2正则化训练了50个时期的模型0.0005
view-logs.py logs/
【文件预览】:
vqa-main
----.gitignore(515B)
----vocab.json(145KB)
----.ipynb_checkpoints()
--------baseline-checkpoint.ipynb(12KB)
----train_models_resnet_no_attn.py(4KB)
----modelNoAttention.py(7KB)
----preprocess-QA.py(2KB)
----vqa_classes.py(3KB)
----image_preprocessing_resnet18.py(2KB)
----vocab.txt(188KB)
----train_models.py(4KB)
----.gitmodules(252B)
----readme-images()
--------popup-env.png(19KB)
--------bottom-left.png(31KB)
----models.py(6KB)
----json_access.py(2KB)
----utils.py(5KB)
----README.md(1KB)
----config.py(1015B)
----train_models_cnn.py(4KB)
----tutorial.py(860B)
----train_models_cnn_noattn.py(4KB)
----view-log.py(2KB)
----read_images.py(3KB)
----.view-log.py.swp(12KB)
----seam_carving.py(12KB)
----resnet.py(7KB)
----annotations()
--------test.json(787KB)
--------val.json(4.27MB)
--------train.json(20.09MB)
----data.py(9KB)
----image_preprocessing_CNN.py(2KB)