DerrangedGadgeteer/SD-GAI

Name: DerrangedGadgeteer/SD-GAI
Creator: DerrangedGadgeteer
Published: 2022-12-03 11:29:47
License: 暂无描述

Hugging Face2022-12-03 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/DerrangedGadgeteer/SD-GAI

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是一个由社区选择的AI生成图像集合，旨在微调Stable Diffusion 1.5和/或Stable Diffusion 2.0模型，以生成特定艺术风格的图像。数据集不包含任何主要媒体公司拥有的图像，也不包含艺术家不愿意用于训练AI的作品。用户提交的AI生成图像及其文本描述将用于训练模型，图像格式为512x512或768x768的.jpeg或.png文件，文本描述为.txt文件。数据集的目标是通过使用AI生成或自愿提供的输入，构建与使用受版权保护材料训练的模型一样好或更好的Stable Diffusion模型。

本数据集由社区甄选的AI生成图像组成，旨在针对特定目标艺术风格对Stable Diffusion 1.5及/或Stable Diffusion 2.0进行微调。所有图像均不来自大型传媒公司，也不来自不愿其作品被用于AI训练的艺术家。提交要求：需提交您自行生成的AI图像，并附带描述图像主题的文本文件。文件名可任意设定，但图像与对应文本文件的文件名必须完全一致。若您为传统数字艺术家并希望参与贡献，请在文本文件中附上清晰的使用许可证明材料（详见下述规则）。格式要求：图像需为.jpeg或.png格式，分辨率为512x512，优先采用768x768；文本文件需为.txt格式，内容为描述图像内容的简短单字列表（无需使用生成提示词，请以您自身的语言描述图像）。提交位置：请选择最贴合您所创作风格的目录。建议先查看若干已提交的图像以确认匹配度。若您的作品属于全新风格，请准备至少4张同风格图像，并拟定一个富有创意的风格名称，同时新建专属目录进行提交。图像使用计划：待技术问题解决后，当某一风格的768px图像累计达到至少50张时，我将使用Hugging Face Diffusers的DreamBooth示例脚本对Stable Diffusion 2.0模型进行微调训练。我将记录训练的配置与流程，并将最终得到的模型上传至本页面供下载。当某一风格的图像累计达到约1000张时，我将基于提供的文本-图像对，开始研发原生微调模型。在此之前，所有图像与文本描述均会在本页面公开。若您日后希望将本数据集用于自身的训练项目，数据均可免费获取并用于AI训练（需遵守相关许可协议及Hugging Face服务条款）。本项目不接收已训练模型、其他代码或工具类提交。 GAI零号规则：本项目的目标是仅使用AI生成图像或志愿者提交的内容，训练出性能不低于甚至优于基于受版权保护材料训练的Stable Diffusion模型。任何不符合该目标的内容都将被审核并移除。请勿试图偷偷上传受版权保护的材料、非法内容、猎奇内容或仇恨言论，不要制造问题。我理解有趣的整活，但我们需要紧扣项目主题。 GAI一号规则：未经艺术家明确许可，不得使用人类艺术家创作的图像。-如需证明艺术家的使用许可，请在文本文件中附上公开声明的链接（例如社交媒体帖子），该声明需明确允许使用相关单张图像或包含该图像的图像集。-链接需满足以下要求：1）可独立验证其确实来自对应艺术家；2）明确指向相关单张图像，或指向清晰包含该图像的图像集；3）明确说明允许将相关图像用于AI训练。-欢迎社区成员协助对提交至数据集的图像进行反向图片搜索，并协助审核内容。我仅为一名普通爱好者，将尽最大努力跟进提交的图像，但我并非无所不能，也不敢自诩擅长内容审核。 GAI二号规则：为艺术风格命名时，请使用富有创意且具有描述性的名称，而非艺术家姓名、笔名、商号或传媒公司的商标。-这正是本数据集的核心目标之一：向更广泛的艺术界证明，AI并非仅仅复刻现有作品；同时也可规避潜在的诉讼风险与未来的法律变更带来的影响。-合规使用AI的用户无意伪造、替代或冒充现有艺术家，我们仅希望获得具备特定视觉风格或更具美感的图像。因此，请不要使用艺术家姓名或现有IP进行提示词创作，而是直接描述您期望生成的图像内容，交由AI完成后续创作。 GAI三号规则：NSFW（不适宜工作场合）内容允许提交，但需单独存放。儿童色情相关材料（CSAM）、仇恨言论等“避雷针级”内容均不允许提交，任何违反Hugging Face服务条款的内容也同样禁止。-何为NSFW内容？主要参考美国娱乐软件分级委员会（ESRB）的“青少年（Teen）”评级、美国电影协会（MPAA）的“PG-13”评级，以及主流社交媒体的常规审核标准。若图像边界模糊，可发起讨论。将此类内容单独存放的主要目的是维护项目观感，若某内容对主数据集造成不良影响，将被转移至单独分区。-何为非法内容？主要包括儿童色情材料（CSAM/CP）、涉及未成年人的成人内容，以及任何可能引来执法部门介入的内容。AI并非人类，图像也不等同于真人，此类争议可移步别处讨论。此外，非法内容还包括机密信息、医学影像，以及违反一号规则的未经授权的受版权保护材料。-何为“避雷针级”内容？仇恨言论、基于血统、国籍、性别、性别认同、种族、民族、宗教等身份的歧视性内容，以及无任何艺术价值的刻意猎奇图像。若图像边界模糊，可发起讨论。祝大家创作愉快，感谢所有愿意参与贡献的用户！——DerrangedGadgeteer

提供机构：

DerrangedGadgeteer

原始信息汇总

数据集概述

数据集目的

本数据集旨在收集由社区选出的AI生成的图像，用于微调Stable Diffusion 1.5和/或Stable Diffusion 2.0模型，以特定艺术风格为目标，不使用任何大型媒体公司拥有的图像或未经艺术家同意的作品。

提交要求

图像格式：.jpeg或.png，尺寸为512x512或768x768。
文本描述：.txt文件，包含图像内容的一词描述。
文件命名：图像与文本描述文件需使用相同文件名。
艺术家作品：若使用，需包含艺术家明确许可的文本文件。

提交方式

根据艺术风格选择相应的目录提交。
若为新风格，需准备至少4张相似风格图像及一个创意风格名称，并创建新目录。

数据集用途

用于训练Stable Diffusion 2.0模型，特别是768px图像，一旦特定风格累积至少50张图像。
将记录训练过程，并提供训练后的模型供下载。
若累积至1000张图像，将开发原生微调模型，结合提供的文本-图像对。

基本规则

版权图像：禁止使用未经艺术家明确许可的图像。
风格命名：使用创意和描述性名称，避免使用艺术家名、笔名或商标。
内容限制：允许NSFW内容，但需单独存放；禁止非法内容和违反Hugging Face T.O.S的内容。

目标

构建与使用版权材料训练的模型同等或更优的Stable Diffusion模型，仅使用AI生成或志愿提供的输入。

5,000+

优质数据集

54 个

任务类型

进入经典数据集