200万组通用场景图像描述数据(详细描述)【数据堂】
收藏OpenDataLab2024-06-03 更新2024-06-08 收录
下载链接:
https://opendatalab.org.cn/shujutang/shujutang1437
下载链接
链接失效反馈官方服务:
资源简介:
200万组图像及描述,图片类型涵盖风景、动物、花卉树木、人物、汽车、运动、工业以及建筑等多种类别及一个美学子集,描述了图像的整体场景,场景中的细节及图像所表达的情感,描述语言为英语,中文两种语言
This dataset comprises 2 million image-caption pairs. The images cover diverse categories including landscapes, animals, flowers and trees, human portraits, automobiles, sports scenes, industrial scenes, architecture, as well as an aesthetic subset. The captions describe the overall scene of each image, the details within the scene, and the emotions conveyed by the image, and are available in both English and Chinese.
提供机构:
shujutang
创建时间:
2024-06-03
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集包含200万组通用场景图像及详细描述,覆盖风景、动物、人物等多种类别和一个美学子集,描述语言为中英文,文本长度不少于250个汉字,重点描述图像整体场景、细节和情感,准确率不低于95%,图像分辨率为2K及以上,但属于商业数据,仅限企业合作购买。
以上内容由遇见数据集搜集并总结生成



