Visual-Question-Answering:vqa的神经架构

时间:2024-06-07 23:39:52
【文件属性】:

文件名称:Visual-Question-Answering:vqa的神经架构

文件大小:19.21MB

文件格式:ZIP

更新时间:2024-06-07 23:39:52

Python

视觉问答 AttentionModel:我的图像和问题注意模型的代码,以及交叉模式注意BOWIMG:词袋+预训练的GoogLeNet / VGGNet卷积NN模型DatasetPreprocessor:用于预处理VQA数据集和其他快速脚本的代码LSTMCNN:Bi-LSTM + CNN(从头开始)模型LSTMIMG:Bi-LSTM +预训练的GoogLeNet模型准备:在准备阶段编写的代码,例如练习张量流WebApp:运行图像注意力模型的Web应用程序 数据集 要求 Tensorflow- //www.tensorflow.org/install/install_linux NLTK- //www.nltk.org/install.html OpenCV(浅CNN) - 朱古力(预训练的CNN) - 资源 要获取文件“ images.txt”,其中包含文件夹/ images中所有图


网友评论