five

CC12M image-text pairs 数据集

收藏
超神经2024-01-22 更新2024-05-15 收录
下载链接:
https://hyper.ai/cn/datasets/17371
下载链接
链接失效反馈
官方服务:
资源简介:
CC12M (Conceptual 12M) 是一个图像文本对的数据集,专门用于视觉和语言预训练。数据集包含 1200 万个图像文本对。与 CC3M 相比,对于 multiple downstream task 该数据集在长尾视觉识别方面表现更佳。

CC12M (Conceptual 12M) is an image-text pair dataset specifically designed for vision-and-language pre-training. It contains 12 million image-text pairs. Compared with CC3M, this dataset outperforms the latter in long-tailed visual recognition across multiple downstream tasks.
创建时间:
2022-09-22
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
CC12M (Conceptual 12M) 是一个专为视觉与语言预训练设计的图像文本对数据集,包含1200万个样本。相较于CC3M,该数据集在多项下游任务,尤其是长尾视觉识别方面表现更优。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作