Visual7W 视觉问答数据集
收藏超神经2022-09-06 更新2024-05-15 收录
下载链接:
https://hyper.ai/cn/datasets/17956
下载链接
链接失效反馈官方服务:
资源简介:
Visual7W 是一个图像内容理解的数据集,通过对图像区域的文字描述和互相之间的关联,进行视觉问答 (Visual Question Answering) 任务,数据集中不仅包含图像本身,还包括图像区域内容相关的问答。
Visual7W is a dataset for image content understanding. It supports the Visual Question Answering (VQA) task by leveraging textual descriptions of image regions and their interrelationships. The dataset includes not only the original images but also question-answer pairs related to the content of these image regions.
创建时间:
2022-09-02
搜集汇总
数据集介绍

背景与挑战
背景概述
Visual7W是一个用于视觉问答任务的图像理解数据集,基于Visual Genome的子集构建。它包含47,300张图像和327,929个问答对,问题涵盖多种类型并以多选题形式呈现。
以上内容由遇见数据集搜集并总结生成



