five

Visual7W 视觉问答数据集

收藏
超神经2022-09-06 更新2024-05-15 收录
下载链接:
https://hyper.ai/cn/datasets/17956
下载链接
链接失效反馈
官方服务:
资源简介:
Visual7W 是一个图像内容理解的数据集,通过对图像区域的文字描述和互相之间的关联,进行视觉问答 (Visual Question Answering) 任务,数据集中不仅包含图像本身,还包括图像区域内容相关的问答。

Visual7W is a dataset for image content understanding. It supports the Visual Question Answering (VQA) task by leveraging textual descriptions of image regions and their interrelationships. The dataset includes not only the original images but also question-answer pairs related to the content of these image regions.
创建时间:
2022-09-02
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
Visual7W是一个用于视觉问答任务的图像理解数据集,基于Visual Genome的子集构建。它包含47,300张图像和327,929个问答对,问题涵盖多种类型并以多选题形式呈现。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务