CC12M (Conceptual 12M)

Name: CC12M (Conceptual 12M)
Creator: OpenDataLab
Published: 2026-05-24 04:30:13
License: 暂无描述

OpenDataLab2026-05-24 更新2024-05-09 收录

下载链接：

https://opendatalab.org.cn/OpenDataLab/CC12M

下载链接

链接失效反馈

官方服务：

资源简介：

概念12 M (CC12M)，具有约1200万个图像文本对的数据集，旨在用于视觉和语言预训练。与概念字幕 (CC3M) 相比，它更大，涵盖了更多的视觉概念集，该概念集广泛用于图像字幕模型的预训练和端到端训练。

Conceptual 12M (CC12M) is a dataset consisting of approximately 12 million image-text pairs, designed for vision-and-language pre-training. Compared to Conceptual Captions (CC3M), it has a larger scale and covers a more extensive set of visual concepts, which has been widely used for pre-training and end-to-end training of image captioning models.

提供机构：

OpenDataLab

创建时间：

2022-05-30

搜集汇总

数据集介绍