five

nreHieW/SD-Prompts

收藏
Hugging Face2023-12-05 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/nreHieW/SD-Prompts
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是多个子数据集的合集,包括FredZhang7/stable-diffusion-prompts-2.47M、laion/dalle-3-dataset等。数据集的特征包括prompt和source,均为字符串类型。训练集包含7,331,040个样本,文件大小为1,203,940,244.4386747字节。README还提供了数据过滤和去重的代码示例。

该数据集是多个子数据集的合集,包括FredZhang7/stable-diffusion-prompts-2.47M、laion/dalle-3-dataset等。数据集的特征包括prompt和source,均为字符串类型。训练集包含7,331,040个样本,文件大小为1,203,940,244.4386747字节。README还提供了数据过滤和去重的代码示例。
提供机构:
nreHieW
原始信息汇总

数据集概述

许可证

  • 许可证类型:Apache 2.0

数据集信息

  • 特征
    • prompt:字符串类型
    • source:字符串类型
  • 拆分
    • train
      • 字节数:1203940244.4386747
      • 样本数:7331040
  • 下载大小:559938627
  • 数据集大小:1203940244.4386747

配置

  • 配置名称:default
  • 数据文件
    • traindata/train-*

数据集组成

  • 包含以下数据集的编译:
    • FredZhang7/stable-diffusion-prompts-2.47M
    • laion/dalle-3-dataset
    • Multimodal-Fatima/COCO_captions_train
    • recastai/LAION-art-EN-improved-captions
    • succinctly/midjourney-prompts
    • Geonmo/midjourney-prompts-only
    • daspartho/stable-diffusion-prompts

数据处理

  • 过滤
    • 过滤条件:prompt 单词数在 3 到 150 之间,且大写字母数少于 10 个。
  • 去重
    • 使用集合存储已见过的 prompt,过滤重复项。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作