five

VizWiz 盲人视觉问答数据集

收藏
超神经2024-02-09 更新2024-05-15 收录
下载链接:
https://hyper.ai/cn/datasets/17831
下载链接
链接失效反馈
官方服务:
资源简介:
VizWiz-VQA (Visual Question Answering) 是一个盲人视觉问答的图像数据集。盲人用户使用 VizWiz 软件拍摄一张照片,并记录一个关于该照片的口头问题和该问题的 10 个众包答案。该数据集用于解决以下两个问题,一是预测一个视觉问题的答案,二是判断一个视觉问题能否被回答。该数据集旨在研究更多通用算法,帮助盲人解决生活障碍。

VizWiz-VQA (Visual Question Answering) is an image dataset for blind-oriented visual question answering. Blind users capture a photograph via the VizWiz software, and document an oral question regarding the photo along with 10 crowd-sourced answers to the question. This dataset addresses two core research tasks: predicting the answer to a given visual question, and determining whether the visual question is answerable. The dataset aims to develop general-purpose algorithms to help blind individuals overcome daily living obstacles.
创建时间:
2022-09-23
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
VizWiz是一个盲人视觉问答数据集,包含由盲人用户拍摄的照片、口头问题及众包答案,用于训练算法预测答案和评估问题可答性,以辅助盲人克服生活障碍。数据集提供超过2万对训练图像/问题和答案,以及验证和测试集,总大小约17.65 GB,采用CC BY 4.0许可证。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务