数据堂—200万组通用场景图像描述数据(详细描述)
收藏魔搭社区2025-11-23 更新2024-05-15 收录
下载链接:
https://modelscope.cn/datasets/DatatangBeijing/2MillionPairsImageCaptionDataOfGeneralScenes
下载链接
链接失效反馈官方服务:
资源简介:
200万组图像及描述,图片类型涵盖风景、动物、花卉树木、人物、汽车、运动、工业以及建筑等多种类别及一个美学子集,描述了图像的整体场景,场景中的细节及图像所表达的情感,描述语言为英语,中文两种语言
This dataset comprises 2 million image-description pairs. The images span diverse categories including landscapes, animals, flowers and trees, human subjects, automobiles, sports, industrial scenes, and architecture, alongside an aesthetic subset. Each description elaborates on the overall scene of the corresponding image, the specific details within the scene, and the emotional connotation conveyed by the image, and is available in both English and Chinese.
提供机构:
maas
创建时间:
2024-05-11
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集包含200万组通用场景图像及其描述,图像类型涵盖风景、动物、人物、建筑等多种类别。描述内容包含整体场景、细节和情感表达,提供中英文版本,图像分辨率在2K以上且描述准确率不低于95%。
以上内容由遇见数据集搜集并总结生成



