five

数据堂—700,000组通用场景图像描述数据(简单描述)

收藏
魔搭社区2025-12-03 更新2024-05-15 收录
下载链接:
https://modelscope.cn/datasets/DatatangBeijing/700ThousandSetsImageCaptionDataOfGeneralScenes
下载链接
链接失效反馈
官方服务:
资源简介:
700,000组图像及描述,图片类型涵盖风景、动物、花卉树木、人物、汽车、运动、工业以及建筑等多种类别及一个美学子集,每张图不少于两种描述,每种描述一句话;少部分图像只有一种描述,描述语言为英语,中文两种语言

This dataset contains 700,000 image-caption pairs. The images span diverse categories including landscapes, animals, flowers and trees, human figures, automobiles, sports scenes, industrial scenarios, architecture, as well as a subset focused on American students. Each image is paired with at least two captions, with each caption consisting of one single sentence; a small number of images only have one caption. All captions are available in both English and Chinese.
提供机构:
maas
创建时间:
2024-05-10
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集包含70万组通用场景图像及其描述,覆盖风景、动物、人物等多个类别,每张图像至少有两个中英文句子描述。它主要用于测试通用场景图像描述任务,数据格式为.jpg图像和.txt文本,描述准确率超过95%。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务