VizWiz 盲人视觉问答数据集

超神经2024-02-09 更新2024-05-15 收录

下载链接：

https://hyper.ai/cn/datasets/17831

下载链接

链接失效反馈

官方服务：

资源简介：

VizWiz-VQA (Visual Question Answering) 是一个盲人视觉问答的图像数据集。盲人用户使用 VizWiz 软件拍摄一张照片，并记录一个关于该照片的口头问题和该问题的 10 个众包答案。该数据集用于解决以下两个问题，一是预测一个视觉问题的答案，二是判断一个视觉问题能否被回答。该数据集旨在研究更多通用算法，帮助盲人解决生活障碍。

VizWiz-VQA (Visual Question Answering) is an image dataset for blind-oriented visual question answering. Blind users capture a photograph via the VizWiz software, and document an oral question regarding the photo along with 10 crowd-sourced answers to the question. This dataset addresses two core research tasks: predicting the answer to a given visual question, and determining whether the visual question is answerable. The dataset aims to develop general-purpose algorithms to help blind individuals overcome daily living obstacles.

创建时间：

2022-09-23

搜集汇总

数据集介绍

背景与挑战

背景概述

VizWiz是一个盲人视觉问答数据集，包含由盲人用户拍摄的照片、口头问题及众包答案，用于训练算法预测答案和评估问题可答性，以辅助盲人克服生活障碍。数据集提供超过2万对训练图像/问题和答案，以及验证和测试集，总大小约17.65 GB，采用CC BY 4.0许可证。

以上内容由遇见数据集搜集并总结生成