CC12M image-text pairs 数据集

超神经2024-01-22 更新2024-05-15 收录

下载链接：

https://hyper.ai/cn/datasets/17371

下载链接

链接失效反馈

官方服务：

资源简介：

CC12M (Conceptual 12M) 是一个图像文本对的数据集，专门用于视觉和语言预训练。数据集包含 1200 万个图像文本对。与 CC3M 相比，对于 multiple downstream task 该数据集在长尾视觉识别方面表现更佳。

CC12M (Conceptual 12M) is an image-text pair dataset specifically designed for vision-and-language pre-training. It contains 12 million image-text pairs. Compared with CC3M, this dataset outperforms the latter in long-tailed visual recognition across multiple downstream tasks.

创建时间：

2022-09-22

搜集汇总

数据集介绍

背景与挑战

背景概述

CC12M (Conceptual 12M) 是一个专为视觉与语言预训练设计的图像文本对数据集，包含1200万个样本。相较于CC3M，该数据集在多项下游任务，尤其是长尾视觉识别方面表现更优。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集