nreHieW/SD-Prompts
收藏Hugging Face2023-12-05 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/nreHieW/SD-Prompts
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是多个子数据集的合集,包括FredZhang7/stable-diffusion-prompts-2.47M、laion/dalle-3-dataset等。数据集的特征包括prompt和source,均为字符串类型。训练集包含7,331,040个样本,文件大小为1,203,940,244.4386747字节。README还提供了数据过滤和去重的代码示例。
该数据集是多个子数据集的合集,包括FredZhang7/stable-diffusion-prompts-2.47M、laion/dalle-3-dataset等。数据集的特征包括prompt和source,均为字符串类型。训练集包含7,331,040个样本,文件大小为1,203,940,244.4386747字节。README还提供了数据过滤和去重的代码示例。
提供机构:
nreHieW
原始信息汇总
数据集概述
许可证
- 许可证类型:Apache 2.0
数据集信息
- 特征:
prompt:字符串类型source:字符串类型
- 拆分:
train:- 字节数:1203940244.4386747
- 样本数:7331040
- 下载大小:559938627
- 数据集大小:1203940244.4386747
配置
- 配置名称:default
- 数据文件:
train:data/train-*
数据集组成
- 包含以下数据集的编译:
FredZhang7/stable-diffusion-prompts-2.47Mlaion/dalle-3-datasetMultimodal-Fatima/COCO_captions_trainrecastai/LAION-art-EN-improved-captionssuccinctly/midjourney-promptsGeonmo/midjourney-prompts-onlydaspartho/stable-diffusion-prompts
数据处理
- 过滤:
- 过滤条件:
prompt单词数在 3 到 150 之间,且大写字母数少于 10 个。
- 过滤条件:
- 去重:
- 使用集合存储已见过的
prompt,过滤重复项。
- 使用集合存储已见过的



