five

VQA Dataset

收藏
知名数据集2026-04-23 收录
下载链接:
https://visualqa.org/
下载链接
链接失效反馈
官方服务:
资源简介:
VQA(Visual Question Answering)数据集是由佐治亚理工学院和Facebook AI Research等机构开发的开放式视觉问答基准数据集。该数据集包含约26.5万张图像(来自COCO数据集和抽象场景),每张图像配有多个开放式问题,需要结合视觉理解、语言处理和常识知识来回答。数据集主要用于评估多模态模型在视觉问答任务上的表现,是计算机视觉与自然语言处理交叉领域的重要研究资源。
提供机构:
佐治亚理工学院; Facebook AI Research
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作