VizWiz-Captions

Name: VizWiz-Captions
Creator: OpenDataLab
Published: 2026-05-24 04:30:03
License: 暂无描述

OpenDataLab2026-05-24 更新2024-05-09 收录

下载链接：

https://opendatalab.org.cn/OpenDataLab/VizWiz-Captions

下载链接

链接失效反馈

官方服务：

资源简介：

“VizWiz-Captions 数据集包括：23,431 个训练图像 117,155 个训练字幕 7,750 个验证图像 38,750 个验证字幕 8,000 个测试图像 40,000 个测试字幕”

The VizWiz-Captions dataset comprises: 23,431 training images paired with 117,155 training captions, 7,750 validation images paired with 38,750 validation captions, and 8,000 test images paired with 40,000 test captions.

提供机构：

OpenDataLab

创建时间：

2022-05-09

搜集汇总

数据集介绍

背景与挑战

背景概述

VizWiz-Captions是一个用于图像字幕生成的大规模数据集，包含超过20万张图像和相应的字幕，由得克萨斯大学于2020年发布。该数据集特别关注盲人拍摄的图像字幕生成，适用于计算机视觉和自然语言处理的研究。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集