Visual7W

arXiv2025-09-30 收录

下载链接：

http://ai.stanford.edu/~yukez/visual7w/

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是一个用于视觉问答任务的集合，它要求模型使用更复杂的推理来回答关于图片的问题。此外，该数据集通常与其他数据集结合使用，以在视觉和语言任务中进行训练和验证。该数据集包含大约15,000张图片，主要针对的是视觉问题解答任务。

This dataset is a collection tailored for visual question answering (VQA) tasks, which mandates models to utilize more sophisticated reasoning to answer image-related questions. Additionally, it is frequently combined with other datasets for training and validation across vision-and-language tasks. Containing roughly 15,000 images, this dataset primarily targets visual question answering tasks.

5,000+

优质数据集

54 个

任务类型

进入经典数据集