vqa:视觉问答

时间:2024-03-08 01:14:10
【文件属性】:

文件名称:vqa:视觉问答

文件大小:1.78MB

文件格式:ZIP

更新时间:2024-03-08 01:14:10

Python

VQA 视觉问答 运行代码 该模型基于在运行代码之前,请从下载相关的训练,验证和测试数据。下面的部分根据需要Resnet-18或CNN的结果告诉您要运行哪些脚本 有线电视新闻网 我们按照以下顺序运行脚本以获得最佳结果 image_preprocessing_CNN.py 这将从图像中提取特征 preprocess-QA.py 这从提出的问题中提取特征 train_models_cnn.py 这使用L2正则化训练了50个时期的模型0.0005 view-logs.py logs/ 打印出结果 ResNet-18 我们按照以下顺序运行脚本以获得最佳结果 image_preprocessing_resnet18.py 这将从图像中提取特征 preprocess-QA.py 这从提出的问题中提取特征 train_models.py 这使用L2正则化0.001训练了50个时


【文件预览】:
vqa-main
----.gitignore(515B)
----vocab.json(145KB)
----.ipynb_checkpoints()
--------baseline-checkpoint.ipynb(12KB)
----train_models_resnet_no_attn.py(4KB)
----modelNoAttention.py(7KB)
----preprocess-QA.py(2KB)
----vqa_classes.py(3KB)
----image_preprocessing_resnet18.py(2KB)
----vocab.txt(188KB)
----train_models.py(4KB)
----.gitmodules(252B)
----readme-images()
--------popup-env.png(19KB)
--------bottom-left.png(31KB)
----models.py(6KB)
----json_access.py(2KB)
----utils.py(5KB)
----README.md(1KB)
----config.py(1015B)
----train_models_cnn.py(4KB)
----tutorial.py(860B)
----train_models_cnn_noattn.py(4KB)
----view-log.py(2KB)
----read_images.py(3KB)
----.view-log.py.swp(12KB)
----seam_carving.py(12KB)
----resnet.py(7KB)
----annotations()
--------test.json(787KB)
--------val.json(4.27MB)
--------train.json(20.09MB)
----data.py(9KB)
----image_preprocessing_CNN.py(2KB)

网友评论

  • 用户下载后在一定时间内未进行评价,系统默认好评。