DerrangedGadgeteer/SD-GAI
收藏Hugging Face2022-12-03 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/DerrangedGadgeteer/SD-GAI
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个由社区选择的AI生成图像集合,旨在微调Stable Diffusion 1.5和/或Stable Diffusion 2.0模型,以生成特定艺术风格的图像。数据集不包含任何主要媒体公司拥有的图像,也不包含艺术家不愿意用于训练AI的作品。用户提交的AI生成图像及其文本描述将用于训练模型,图像格式为512x512或768x768的.jpeg或.png文件,文本描述为.txt文件。数据集的目标是通过使用AI生成或自愿提供的输入,构建与使用受版权保护材料训练的模型一样好或更好的Stable Diffusion模型。
本数据集由社区甄选的AI生成图像组成,旨在针对特定目标艺术风格对Stable Diffusion 1.5及/或Stable Diffusion 2.0进行微调。所有图像均不来自大型传媒公司,也不来自不愿其作品被用于AI训练的艺术家。
提交要求:需提交您自行生成的AI图像,并附带描述图像主题的文本文件。文件名可任意设定,但图像与对应文本文件的文件名必须完全一致。
若您为传统数字艺术家并希望参与贡献,请在文本文件中附上清晰的使用许可证明材料(详见下述规则)。
格式要求:图像需为.jpeg或.png格式,分辨率为512x512,优先采用768x768;文本文件需为.txt格式,内容为描述图像内容的简短单字列表(无需使用生成提示词,请以您自身的语言描述图像)。
提交位置:请选择最贴合您所创作风格的目录。建议先查看若干已提交的图像以确认匹配度。若您的作品属于全新风格,请准备至少4张同风格图像,并拟定一个富有创意的风格名称,同时新建专属目录进行提交。
图像使用计划:待技术问题解决后,当某一风格的768px图像累计达到至少50张时,我将使用Hugging Face Diffusers的DreamBooth示例脚本对Stable Diffusion 2.0模型进行微调训练。我将记录训练的配置与流程,并将最终得到的模型上传至本页面供下载。当某一风格的图像累计达到约1000张时,我将基于提供的文本-图像对,开始研发原生微调模型。在此之前,所有图像与文本描述均会在本页面公开。若您日后希望将本数据集用于自身的训练项目,数据均可免费获取并用于AI训练(需遵守相关许可协议及Hugging Face服务条款)。本项目不接收已训练模型、其他代码或工具类提交。
GAI零号规则:本项目的目标是仅使用AI生成图像或志愿者提交的内容,训练出性能不低于甚至优于基于受版权保护材料训练的Stable Diffusion模型。任何不符合该目标的内容都将被审核并移除。请勿试图偷偷上传受版权保护的材料、非法内容、猎奇内容或仇恨言论,不要制造问题。我理解有趣的整活,但我们需要紧扣项目主题。
GAI一号规则:未经艺术家明确许可,不得使用人类艺术家创作的图像。-如需证明艺术家的使用许可,请在文本文件中附上公开声明的链接(例如社交媒体帖子),该声明需明确允许使用相关单张图像或包含该图像的图像集。-链接需满足以下要求:1)可独立验证其确实来自对应艺术家;2)明确指向相关单张图像,或指向清晰包含该图像的图像集;3)明确说明允许将相关图像用于AI训练。-欢迎社区成员协助对提交至数据集的图像进行反向图片搜索,并协助审核内容。我仅为一名普通爱好者,将尽最大努力跟进提交的图像,但我并非无所不能,也不敢自诩擅长内容审核。
GAI二号规则:为艺术风格命名时,请使用富有创意且具有描述性的名称,而非艺术家姓名、笔名、商号或传媒公司的商标。-这正是本数据集的核心目标之一:向更广泛的艺术界证明,AI并非仅仅复刻现有作品;同时也可规避潜在的诉讼风险与未来的法律变更带来的影响。-合规使用AI的用户无意伪造、替代或冒充现有艺术家,我们仅希望获得具备特定视觉风格或更具美感的图像。因此,请不要使用艺术家姓名或现有IP进行提示词创作,而是直接描述您期望生成的图像内容,交由AI完成后续创作。
GAI三号规则:NSFW(不适宜工作场合)内容允许提交,但需单独存放。儿童色情相关材料(CSAM)、仇恨言论等“避雷针级”内容均不允许提交,任何违反Hugging Face服务条款的内容也同样禁止。-何为NSFW内容?主要参考美国娱乐软件分级委员会(ESRB)的“青少年(Teen)”评级、美国电影协会(MPAA)的“PG-13”评级,以及主流社交媒体的常规审核标准。若图像边界模糊,可发起讨论。将此类内容单独存放的主要目的是维护项目观感,若某内容对主数据集造成不良影响,将被转移至单独分区。-何为非法内容?主要包括儿童色情材料(CSAM/CP)、涉及未成年人的成人内容,以及任何可能引来执法部门介入的内容。AI并非人类,图像也不等同于真人,此类争议可移步别处讨论。此外,非法内容还包括机密信息、医学影像,以及违反一号规则的未经授权的受版权保护材料。-何为“避雷针级”内容?仇恨言论、基于血统、国籍、性别、性别认同、种族、民族、宗教等身份的歧视性内容,以及无任何艺术价值的刻意猎奇图像。若图像边界模糊,可发起讨论。
祝大家创作愉快,感谢所有愿意参与贡献的用户!——DerrangedGadgeteer
提供机构:
DerrangedGadgeteer
原始信息汇总
数据集概述
数据集目的
本数据集旨在收集由社区选出的AI生成的图像,用于微调Stable Diffusion 1.5和/或Stable Diffusion 2.0模型,以特定艺术风格为目标,不使用任何大型媒体公司拥有的图像或未经艺术家同意的作品。
提交要求
- 图像格式:.jpeg或.png,尺寸为512x512或768x768。
- 文本描述:.txt文件,包含图像内容的一词描述。
- 文件命名:图像与文本描述文件需使用相同文件名。
- 艺术家作品:若使用,需包含艺术家明确许可的文本文件。
提交方式
- 根据艺术风格选择相应的目录提交。
- 若为新风格,需准备至少4张相似风格图像及一个创意风格名称,并创建新目录。
数据集用途
- 用于训练Stable Diffusion 2.0模型,特别是768px图像,一旦特定风格累积至少50张图像。
- 将记录训练过程,并提供训练后的模型供下载。
- 若累积至1000张图像,将开发原生微调模型,结合提供的文本-图像对。
基本规则
- 版权图像:禁止使用未经艺术家明确许可的图像。
- 风格命名:使用创意和描述性名称,避免使用艺术家名、笔名或商标。
- 内容限制:允许NSFW内容,但需单独存放;禁止非法内容和违反Hugging Face T.O.S的内容。
目标
构建与使用版权材料训练的模型同等或更优的Stable Diffusion模型,仅使用AI生成或志愿提供的输入。



