AI Challenger图像中文描述数据集
收藏阿里云天池2026-05-27 更新2024-03-07 收录
下载链接:
https://tianchi.aliyun.com/dataset/145781
下载链接
链接失效反馈官方服务:
资源简介:
数据来自2017 AI Challenger,数据集对给定的每一张图片有五句话的中文描述。数据集包含30万张图片,150万句中文描述。训练集:210,000 张,验证集:30,000 张,测试集 A:30,000 张,测试集 B:30,000 张。
This dataset originates from the 2017 AI Challenger. Each image in the dataset is paired with five Chinese captions. The full dataset comprises 300,000 images and 1.5 million Chinese captions, with the data split as follows: training set with 210,000 images, validation set with 30,000 images, test set A with 30,000 images, and test set B with 30,000 images.
提供机构:
阿里云天池
创建时间:
2023-02-15
搜集汇总
数据集介绍

背景与挑战
背景概述
AI Challenger图像中文描述数据集包含30万张图片和150万句中文描述,每张图片有五句话的中文描述。数据集分为训练集(210,000张)、验证集(30,000张)和两个测试集(各30,000张),适用于计算机视觉与自然语言处理的跨领域研究。
以上内容由遇见数据集搜集并总结生成



