COCO-CN
收藏arXiv2025-09-30 收录
下载链接:
https://github.com/li-xirong/coco-cn
下载链接
链接失效反馈官方服务:
资源简介:
该数据集为20,341张MS-COCO图片提供了中文(简体)标题,其中6,748张来自COCO验证集的图片被用作测试集。此外,数据集还包括了5,000句从英文标题手动翻译成中文的句子,这些句子用于计算BLEU分数。该数据集的规模为20,341张图片,任务涉及多语言文本到图像的生成。
This dataset provides Simplified Chinese captions for 20,341 images from the MS-COCO dataset. Of these, 6,748 images from the COCO validation set are used as the test set. Additionally, the dataset contains 5,000 manually translated Chinese sentences derived from English captions, which are employed for BLEU score calculation. The dataset consists of a total of 20,341 images, and the corresponding task covers multilingual text-to-image generation.
提供机构:
MS-COCO
搜集汇总
数据集介绍

背景与挑战
背景概述
COCO-CN是一个双语图像描述数据集,基于MS-COCO扩展,添加了手动编写的中文句子和标签,支持跨语言图像标记、描述和检索任务。数据集包含20,341张图像,分为训练、验证和测试集,其中部分句子为手动翻译,适用于多媒体研究和应用。
以上内容由遇见数据集搜集并总结生成



