five

FredZhang7/stable-diffusion-prompts-2.47M

收藏
Hugging Face2023-02-11 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/FredZhang7/stable-diffusion-prompts-2.47M
下载链接
链接失效反馈
官方服务:
资源简介:
SDP-2.47M数据集是一个包含247万条文本提示的数据集,主要用于文本生成任务。数据集来源于多个公开的文本生成数据集,包括poloclub/diffusiondb、Gustavosta/Stable-Diffusion-Prompts、bartman081523/stable-diffusion-discord-prompts和FredZhang7/krea-ai-prompts。数据集经过预处理,适用于GPT-2等模型的训练。

--- license: creativeml-openrail-m(CreativeML-OpenRail-M许可协议) task_categories: - 文本生成 language: - 英语 pretty_name: SDP-2.47M size_categories: - 100万 < 样本数量 < 1000万 --- ## 数据集来源 本数据集为多源纯文本提示词数据集,整合自以下来源: - poloclub/diffusiondb - Gustavosta/Stable-Diffusion-Prompts - bartman081523/stable-diffusion-discord-prompts - FredZhang7/krea-ai-prompts 有关数据集预处理的具体方法,请参阅 [Fast GPT2 PromptGen](https://huggingface.co/FredZhang7/distilgpt2-stable-diffusion-v2)。 ## Python 操作示例 将数据集下载并本地保存为 `all_prompts.txt`: bash pip install datasets python import datasets dataset = datasets.load_dataset("FredZhang7/stable-diffusion-prompts-2.47M") train = dataset["train"] prompts = train["text"] with open("all_prompts.txt", "w") as f: for prompt in prompts: f.write(prompt + " ")
提供机构:
FredZhang7
原始信息汇总

数据集概述

基本信息

  • 许可证: creativeml-openrail-m
  • 任务类别: 文本生成
  • 语言: 英语
  • 数据集名称: SDP-2.47M
  • 大小范围: 1M<n<10M

数据来源

  • poloclub/diffusiondb
  • Gustavosta/Stable-Diffusion-Prompts
  • bartman081523/stable-diffusion-discord-prompts
  • FredZhang7/krea-ai-prompts

使用方法

  • 通过Python脚本下载并保存数据集至本地文件all_prompts.txt
  • 使用datasets库加载数据集,并提取训练集中的文本内容。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作