数据堂—1,000,000组通用场景图像描述数据
收藏魔搭社区2026-01-06 更新2024-05-15 收录
下载链接:
https://modelscope.cn/datasets/DatatangBeijing/1000000SetsImageCaptionDataOfGeneralScenes
下载链接
链接失效反馈官方服务:
资源简介:
700,000组图像及描述,图片类型涵盖风景、动物、花卉树木、人物、汽车、运动、工业以及建筑等多种类别及一个美学子集,每张图不少于两种描述,每种描述一句话;少部分图像只有一种描述,描述语言为英语,中文两种语言
This dataset consists of 700,000 image-text pairs. The included images cover various categories such as landscapes, animals, flowers and trees, human figures, automobiles, sports scenes, industrial settings, architecture, as well as a subset targeting American students. Each image is equipped with at least two descriptions, each being a single sentence; a small number of images only have one description. All descriptions are provided in both English and Chinese.
提供机构:
maas
创建时间:
2024-04-30
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集由数据堂提供,包含100万组通用场景图像及其描述,图像涵盖风景、动物、人物、建筑等多种类别,每个图像至少有两个单句描述,语言包括中文和英文。数据集为商业用途,采用.jpg图像和.txt文本格式。
以上内容由遇见数据集搜集并总结生成



