five

VQA (v2.0) 开放式问答数据集

收藏
超神经2022-08-16 更新2024-05-15 收录
下载链接:
https://hyper.ai/cn/datasets/15514
下载链接
链接失效反馈
官方服务:
资源简介:
VQA (v2.0) 全称 Visual Question Answering (v2.0),是一个人工标注的、关于图像的开放式问答数据集。回答这些问题,需要对图像、语言以及常识都具备一定的理解力。

VQA (v2.0), whose full name is Visual Question Answering (v2.0), is a manually annotated open-ended visual question answering dataset focused on images. Answering these questions requires a certain degree of comprehension of images, language, and general common sense.
创建时间:
2022-06-16
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
VQA (v2.0) 是一个视觉问答数据集,包含265,016张图像和每幅图像平均5.4个问题,每个问题提供10个基准答案和3个合理答案,旨在通过补充图片减少语言偏见。该数据集需要综合理解图像、语言和常识,适用于机器视觉和自然语言处理任务。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务