twodgirl_diffusers_to_flux_script

Hugging Face2024-10-19 更新2024-12-12 收录

下载链接：

https://huggingface.co/datasets/John6666/twodgirl_diffusers_to_flux_script

下载链接

链接失效反馈

官方服务：

资源简介：

Flux D+S F8 Diffusers模型是一个A+B合并模型，设计用于Gradio推理，并可基于diffusers库构建适配器。该模型需要10个步骤来生成清晰的图像，并且可以转换为与ComfyUI兼容的格式。使用该模型时，需要引用和归功于作者，并且共享或重用模型权重需要链接到作者的Hugging Face个人资料。

创建时间：

2024-10-19

原始信息汇总

数据集概述

基本信息

许可证:
- 名称: flux-1-dev-non-commercial-license
- 链接: https://huggingface.co/black-forest-labs/FLUX.1-dev/blob/main/LICENSE.md
基础模型:
- ashen0209/Flux-Dev2Pro
- black-forest-labs/FLUX.1-schnell
标签:
- text-to-image
- flux
- merge

示例

示例1:
- 文本: Example 1
- 输出: images/0015.webp
示例2:
- 文本: Example 2
- 输出: images/0022.webp
示例3:
- 文本: Example 3
- 输出: images/0012.webp
示例4:
- 文本: Example 4
- 输出: images/0014.webp
示例5:
- 文本: Example 5
- 输出: images/0033.webp
示例6:
- 文本: Example 6
- 输出: images/0032.webp

推理

步骤: 需要10步，否则图像会模糊。

ComfyUI

转换脚本:
- 下载数据集内容并进入目录。
- 安装依赖: pip install safetensors torch
- 运行转换脚本: python flux_devpro_ckpt.py transformer/diffusion_pytorch_model.safetensors flux-devpro-schnell.safetensors
- 移动转换后的文件: mv flux-devpro-schnell.safetensors path/to/your/ComfyUI/models/unet/flux-devpro-schnell.safetensors
- 在ComfyUI中加载模型时，LoadDiffusionModel节点应使用两个值: flux-devpro-schnell.safetensors, fp8_e4m3fn。

免责声明

引用和归属: 使用此代码需要引用并归功于作者，并在所有结果作品中包含指向其Hugging Face个人资料的链接。
模型来源: 源模型由Ashen0209和BFL上传。

搜集汇总

数据集介绍

构建方式

twodgirl_diffusers_to_flux_script数据集的构建基于两个基础模型ashen0209/Flux-Dev2Pro和black-forest-labs/FLUX.1-schnell的合并，旨在为文本到图像的生成任务提供支持。该数据集通过diffusers库进行推理，并允许用户在此基础上构建适配器。构建过程中，作者将模型权重转换为ComfyUI兼容的格式，以便于本地使用和进一步开发。

特点

该数据集的特点在于其专注于文本到图像的生成任务，支持Flux模型的推理。数据集中的模型权重经过优化，能够在10步推理后生成清晰的图像。此外，数据集提供了多种文件格式的转换脚本，便于用户在不同平台和工具中使用。数据集的构建还强调了开源共享的精神，要求在使用时引用原作者并链接至其Hugging Face个人主页。

使用方法

使用该数据集时，用户需下载数据集内容并进入相应目录，通过提供的脚本将diffusers格式转换为ComfyUI兼容的格式。转换完成后，用户需将生成的safetensors文件移至ComfyUI的模型目录中。在ComfyUI的工作流中，用户需使用LoadDiffusionModel节点加载转换后的模型权重，并指定fp8_e4m3fn格式。使用该数据集生成的任何作品均需引用原作者并链接至其Hugging Face个人主页。

背景与挑战

背景概述

twodgirl_diffusers_to_flux_script数据集由twodgirl于近期创建，主要基于ashen0209/Flux-Dev2Pro和black-forest-labs/FLUX.1-schnell两个基础模型进行开发。该数据集的核心研究问题在于如何高效地将文本转化为高质量的图像，特别是在使用diffusers库进行推理的过程中。通过合并多个模型，该数据集旨在提升图像生成的清晰度和细节表现，为文本到图像生成领域提供了新的技术路径。其影响力主要体现在为研究人员和开发者提供了一个可扩展的工具，能够在此基础上构建更复杂的图像生成模型。

当前挑战

twodgirl_diffusers_to_flux_script数据集在解决文本到图像生成问题时，面临的主要挑战是如何在有限的推理步骤内生成清晰且细节丰富的图像。实验表明，若推理步骤少于10步，生成的图像会显得模糊，这限制了模型的实时应用能力。在构建过程中，数据集还面临了模型格式转换的复杂性，需要将diffusers格式转换为ComfyUI兼容的格式，这一过程涉及多个文件格式的处理和存储空间的优化。此外，数据集的开发还需严格遵守非商业许可协议，确保在使用和分享模型权重时进行适当的引用和归属。

常用场景

经典使用场景

twodgirl_diffusers_to_flux_script数据集在文本到图像生成领域具有重要应用，尤其是在基于Flux模型的图像生成任务中。该数据集通过合并多个基础模型，优化了图像生成的清晰度和细节表现，特别适用于需要高质量图像输出的场景。研究人员和开发者可以利用该数据集进行图像生成模型的训练和推理，尤其是在Gradio等交互式平台上进行实时图像生成。

衍生相关工作

基于twodgirl_diffusers_to_flux_script数据集，研究者们开发了多种图像生成模型和工具。例如，利用该数据集进行模型融合和优化的研究，推动了文本到图像生成技术的发展。此外，该数据集还催生了多个基于Flux模型的图像生成工具，如ComfyUI等，进一步丰富了图像生成领域的应用生态。

数据集最近研究