scaling-laws-diff-exp/laion500k
收藏Hugging Face2024-05-02 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/scaling-laws-diff-exp/laion500k
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含图像和文本数据,具体特征包括:__key__(字符串类型)、__url__(字符串类型)、depth_image.jpg(图像类型)、image.jpg(图像类型)以及一个包含caption(字符串类型)的json结构。数据集分为一个训练集(train),包含500,000个样本,总大小为55,381,878,468字节。下载大小为55,079,203,250字节。
该数据集包含图像和文本数据,具体特征包括:__key__(字符串类型)、__url__(字符串类型)、depth_image.jpg(图像类型)、image.jpg(图像类型)以及一个包含caption(字符串类型)的json结构。数据集分为一个训练集(train),包含500,000个样本,总大小为55,381,878,468字节。下载大小为55,079,203,250字节。
提供机构:
scaling-laws-diff-exp
原始信息汇总
数据集概述
数据集特征
- key: 数据类型为字符串。
- url: 数据类型为字符串。
- depth_image.jpg: 数据类型为图像。
- image.jpg: 数据类型为图像。
- json: 结构化数据,包含以下字段:
- caption: 数据类型为字符串。
数据集分割
- train:
- 数据量: 55381878468.0 字节
- 示例数量: 500000
数据集大小
- 下载大小: 55079203250 字节
- 数据集大小: 55381878468.0 字节
配置
- default:
- 数据文件路径:
data/train-*
- 数据文件路径:



