文件名称:easy-VQA:Easy Visual Questioning Answering数据集
文件大小:3.12MB
文件格式:ZIP
更新时间:2024-05-24 13:09:17
dataset vqa visual-question-answering vqa-dataset easy-vqa
易vqa Easy Visual Question Answering(easy-VQA)数据集的官方存储库。 包含: 数据集的官方 用于生成数据集的源代码 阅读以获取更多信息。 关于数据集 easy-VQA包含 4,000张火车图像和38,575条火车问题。 1,000个测试图像和9,673个测试问题。 总共13个可能的答案。 28,407个是/否的培训问题。 7,136个是/否的测试问题。 所有图像均为64x64彩色图像。 查看在数据集上训练的模型的。 范例图片 (以上这些图片链接仅适用于Github ) 示例问题 矩形是什么颜色? 图像中是否包含三角形? 没有蓝色的形状吗? 图像包含什么形状? 安装套件 pip install easy-vqa 使用包装 问题 每个问题分为三个部分: 问题文字 答案 图片编号 问题获取器为3个部分中的每个部分返回对应