liangyuch/laion2b_seed
收藏Hugging Face2023-10-20 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/liangyuch/laion2b_seed
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是laion2B-en-aesthetic数据集的一个子集,包含了SEED v1 tokens。数据集包含多个特征,如宽度、高度、相似度、不安全概率、水印概率、标题、URL等,并且提供了训练集的大小和示例数量。
提供机构:
liangyuch
原始信息汇总
数据集概述
数据集信息
特征
- WIDTH: 数据类型为
float64 - HEIGHT: 数据类型为
float64 - similarity: 数据类型为
float64 - punsafe: 数据类型为
float64 - pwatermark: 数据类型为
float64 - caption: 数据类型为
string - url: 数据类型为
string - key: 数据类型为
string - status: 数据类型为
string - error_message: 数据类型为
null - width: 数据类型为
int64 - height: 数据类型为
int64 - original_width: 数据类型为
int64 - original_height: 数据类型为
int64 - exif: 数据类型为
string - sha256: 数据类型为
string - seed: 序列类型为
int64 - id: 数据类型为
string
数据分割
- train: 包含 172871223 个样本,总字节数为 134751345442
数据集大小
- 下载大小: 3195319434 字节
- 数据集大小: 134751345442 字节
数据集来源
- 该数据集是 laion2B-en-aesthetic 的一个子集,包含 SEED v1 令牌。



