FredZhang7/stable-diffusion-prompts-2.47M
收藏Hugging Face2023-02-11 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/FredZhang7/stable-diffusion-prompts-2.47M
下载链接
链接失效反馈官方服务:
资源简介:
SDP-2.47M数据集是一个包含247万条文本提示的数据集,主要用于文本生成任务。数据集来源于多个公开的文本生成数据集,包括poloclub/diffusiondb、Gustavosta/Stable-Diffusion-Prompts、bartman081523/stable-diffusion-discord-prompts和FredZhang7/krea-ai-prompts。数据集经过预处理,适用于GPT-2等模型的训练。
---
license: creativeml-openrail-m(CreativeML-OpenRail-M许可协议)
task_categories:
- 文本生成
language:
- 英语
pretty_name: SDP-2.47M
size_categories:
- 100万 < 样本数量 < 1000万
---
## 数据集来源
本数据集为多源纯文本提示词数据集,整合自以下来源:
- poloclub/diffusiondb
- Gustavosta/Stable-Diffusion-Prompts
- bartman081523/stable-diffusion-discord-prompts
- FredZhang7/krea-ai-prompts
有关数据集预处理的具体方法,请参阅 [Fast GPT2 PromptGen](https://huggingface.co/FredZhang7/distilgpt2-stable-diffusion-v2)。
## Python 操作示例
将数据集下载并本地保存为 `all_prompts.txt`:
bash
pip install datasets
python
import datasets
dataset = datasets.load_dataset("FredZhang7/stable-diffusion-prompts-2.47M")
train = dataset["train"]
prompts = train["text"]
with open("all_prompts.txt", "w") as f:
for prompt in prompts:
f.write(prompt + "
")
提供机构:
FredZhang7
原始信息汇总
数据集概述
基本信息
- 许可证: creativeml-openrail-m
- 任务类别: 文本生成
- 语言: 英语
- 数据集名称: SDP-2.47M
- 大小范围: 1M<n<10M
数据来源
- poloclub/diffusiondb
- Gustavosta/Stable-Diffusion-Prompts
- bartman081523/stable-diffusion-discord-prompts
- FredZhang7/krea-ai-prompts
使用方法
- 通过Python脚本下载并保存数据集至本地文件
all_prompts.txt。 - 使用
datasets库加载数据集,并提取训练集中的文本内容。



