VQA Dataset
收藏知名数据集2026-04-23 收录
下载链接:
https://visualqa.org/
下载链接
链接失效反馈官方服务:
资源简介:
VQA(Visual Question Answering)数据集是由佐治亚理工学院和Facebook AI Research等机构开发的开放式视觉问答基准数据集。该数据集包含约26.5万张图像(来自COCO数据集和抽象场景),每张图像配有多个开放式问题,需要结合视觉理解、语言处理和常识知识来回答。数据集主要用于评估多模态模型在视觉问答任务上的表现,是计算机视觉与自然语言处理交叉领域的重要研究资源。
提供机构:
佐治亚理工学院; Facebook AI Research



