VQA 视觉问答数据集 (Visual Question Answering)
收藏超神经2023-12-22 更新2024-05-15 收录
下载链接:
https://hyper.ai/cn/datasets/28455
下载链接
链接失效反馈官方服务:
资源简介:
本数据集信息来自 Campinas State University MO434 学科知识库。
The information of this dataset is sourced from the MO434 discipline knowledge base of Campinas State University.
创建时间:
2023-12-22
搜集汇总
数据集介绍

背景与挑战
背景概述
VQA视觉问答数据集是一个多模态数据集,用于训练深度学习模型根据图像和自然语言问题生成答案。该数据集基于Hierarchical Question-Image Co-Attention论文,采用TensorFlow/Keras实现,大小为58.91 MB,发布于2年前,适用于视觉理解和问答任务。
以上内容由遇见数据集搜集并总结生成



