CC12M image-text pairs 数据集
收藏超神经2024-01-22 更新2024-05-15 收录
下载链接:
https://hyper.ai/cn/datasets/17371
下载链接
链接失效反馈官方服务:
资源简介:
CC12M (Conceptual 12M) 是一个图像文本对的数据集,专门用于视觉和语言预训练。数据集包含 1200 万个图像文本对。与 CC3M 相比,对于 multiple downstream task 该数据集在长尾视觉识别方面表现更佳。
CC12M (Conceptual 12M) is an image-text pair dataset specifically designed for vision-and-language pre-training. It contains 12 million image-text pairs. Compared with CC3M, this dataset outperforms the latter in long-tailed visual recognition across multiple downstream tasks.
创建时间:
2022-09-22
搜集汇总
数据集介绍

背景与挑战
背景概述
CC12M (Conceptual 12M) 是一个专为视觉与语言预训练设计的图像文本对数据集,包含1200万个样本。相较于CC3M,该数据集在多项下游任务,尤其是长尾视觉识别方面表现更优。
以上内容由遇见数据集搜集并总结生成



