CC152K
收藏arXiv2025-09-30 收录
下载链接:
https://ai.google.com/research/ConceptualCaptions
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为CC152K,是概念性标题(Conceptual Captions)的一个子集,包含了从互联网上搜集的152,000组图像和文本配对。由于缺乏人工标注,CC152K中大约有20%的样本配对存在不匹配的情况。该数据集的规模为152,000组图像和文本配对,其任务是跨模态检索。
提供机构:
Conceptual Captions
搜集汇总
背景与挑战
背景概述
CC152K是概念性标题的子集,包含15.2万组图像-文本配对,其中约20%存在不匹配问题,适用于跨模态检索研究。
以上内容由遇见数据集搜集并总结生成



