FredZhang7/stable-diffusion-prompts-2.47M

Name: FredZhang7/stable-diffusion-prompts-2.47M
Creator: FredZhang7
Published: 2023-02-11 21:59:33
License: 暂无描述

Hugging Face2023-02-11 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/FredZhang7/stable-diffusion-prompts-2.47M

下载链接

链接失效反馈

官方服务：

资源简介：

SDP-2.47M数据集是一个包含247万条文本提示的数据集，主要用于文本生成任务。数据集来源于多个公开的文本生成数据集，包括poloclub/diffusiondb、Gustavosta/Stable-Diffusion-Prompts、bartman081523/stable-diffusion-discord-prompts和FredZhang7/krea-ai-prompts。数据集经过预处理，适用于GPT-2等模型的训练。

--- license: creativeml-openrail-m（CreativeML-OpenRail-M许可协议） task_categories: - 文本生成 language: - 英语 pretty_name: SDP-2.47M size_categories: - 100万 < 样本数量 < 1000万 --- ## 数据集来源本数据集为多源纯文本提示词数据集，整合自以下来源： - poloclub/diffusiondb - Gustavosta/Stable-Diffusion-Prompts - bartman081523/stable-diffusion-discord-prompts - FredZhang7/krea-ai-prompts 有关数据集预处理的具体方法，请参阅 [Fast GPT2 PromptGen](https://huggingface.co/FredZhang7/distilgpt2-stable-diffusion-v2)。 ## Python 操作示例将数据集下载并本地保存为 `all_prompts.txt`： bash pip install datasets python import datasets dataset = datasets.load_dataset("FredZhang7/stable-diffusion-prompts-2.47M") train = dataset["train"] prompts = train["text"] with open("all_prompts.txt", "w") as f: for prompt in prompts: f.write(prompt + " ")

提供机构：

FredZhang7

原始信息汇总

数据集概述

基本信息

许可证: creativeml-openrail-m
任务类别: 文本生成
语言: 英语
数据集名称: SDP-2.47M
大小范围: 1M<n<10M

数据来源

poloclub/diffusiondb
Gustavosta/Stable-Diffusion-Prompts
bartman081523/stable-diffusion-discord-prompts
FredZhang7/krea-ai-prompts

使用方法

通过Python脚本下载并保存数据集至本地文件all_prompts.txt。
使用datasets库加载数据集，并提取训练集中的文本内容。

5,000+

优质数据集

54 个

任务类型

进入经典数据集