five

RedCaps 图像文本对数据集

收藏
超神经2022-10-21 更新2024-05-15 收录
下载链接:
https://hyper.ai/cn/datasets/20359
下载链接
链接失效反馈
官方服务:
资源简介:
RedCaps 是一个大规模的图像-文本对 (image-text pair) 数据集,数据源自 Reddit,总数达 120 万。这些图片和文本描述了各种各样的物体和场景。

RedCaps is a large-scale image-text pair dataset sourced from Reddit, containing a total of 1.2 million image-text pairs. These images and their corresponding textual descriptions cover a wide variety of objects and scenes.
创建时间:
2022-10-11
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
RedCaps是一个大规模图像-文本对数据集,包含120万个样本,数据源自Reddit。该数据集由密歇根大学团队发布,适用于图像识别、文本生成、图像生成和多模态任务。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务