VizWiz-Captions
收藏OpenDataLab2026-05-24 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/VizWiz-Captions
下载链接
链接失效反馈官方服务:
资源简介:
“VizWiz-Captions 数据集包括:23,431 个训练图像 117,155 个训练字幕 7,750 个验证图像 38,750 个验证字幕 8,000 个测试图像 40,000 个测试字幕”
The VizWiz-Captions dataset comprises: 23,431 training images paired with 117,155 training captions, 7,750 validation images paired with 38,750 validation captions, and 8,000 test images paired with 40,000 test captions.
提供机构:
OpenDataLab
创建时间:
2022-05-09
搜集汇总
数据集介绍

背景与挑战
背景概述
VizWiz-Captions是一个用于图像字幕生成的大规模数据集,包含超过20万张图像和相应的字幕,由得克萨斯大学于2020年发布。该数据集特别关注盲人拍摄的图像字幕生成,适用于计算机视觉和自然语言处理的研究。
以上内容由遇见数据集搜集并总结生成



