VQA 视觉问答数据集 (Visual Question Answering)

超神经2023-12-22 更新2024-05-15 收录

下载链接：

https://hyper.ai/cn/datasets/28455

下载链接

链接失效反馈

官方服务：

资源简介：

本数据集信息来自 Campinas State University MO434 学科知识库。

The information of this dataset is sourced from the MO434 discipline knowledge base of Campinas State University.

创建时间：

2023-12-22

搜集汇总

数据集介绍

背景与挑战

背景概述

VQA视觉问答数据集是一个多模态数据集，用于训练深度学习模型根据图像和自然语言问题生成答案。该数据集基于Hierarchical Question-Image Co-Attention论文，采用TensorFlow/Keras实现，大小为58.91 MB，发布于2年前，适用于视觉理解和问答任务。

以上内容由遇见数据集搜集并总结生成