数据堂—3亿组高质量图像描述数据
收藏魔搭社区2025-11-25 更新2024-11-16 收录
下载链接:
https://modelscope.cn/datasets/DatatangBeijing/300millionpairsofhigh-qualityimage-captiondataset
下载链接
链接失效反馈官方服务:
资源简介:
3亿张图像,每张图像对应一条描述。均为摄影师发布的正版图像作品。绝大部分为英文描述,极少部分为中文描述。
This dataset consists of 300 million images, each paired with a corresponding description. All images are legitimate photographic works released by photographers. The vast majority of the accompanying descriptions are in English, with only a very small portion in Chinese.
提供机构:
maas
创建时间:
2024-11-07
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集包含约3亿张高质量图像,每张图像均配有对应的文字描述,描述语言主要为英文,少数为中文。图像格式包括.jpg、.png和.svg等,分辨率达到4K及以上,适用于生成式人工智能训练。
以上内容由遇见数据集搜集并总结生成



