Visual Question Answering (VQA)
收藏OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/Visual_Question_Answering
下载链接
链接失效反馈官方服务:
资源简介:
VQA 是一个包含关于图像的开放式问题的新数据集。这些问题需要对视觉、语言和常识知识的理解才能回答。 265,016 张图片(COCO 和抽象场景) 每张图片至少 3 个问题(平均 5.4 个问题) 每个问题 10 个基本事实答案 每个问题 3 个似是而非(但可能不正确)的答案 自动评估指标
提供机构:
OpenDataLab
创建时间:
2022-04-29



