FLUX.2-klein-base-9B_samples_Best_of
收藏Hugging Face2026-01-28 更新2026-01-29 收录
下载链接:
https://huggingface.co/datasets/stablellama/FLUX.2-klein-base-9B_samples_Best_of
下载链接
链接失效反馈官方服务:
资源简介:
FLUX.2 [klein] 9B Base samples 数据集是一个高度多样化的高质量图像集合,专为训练和正则化目的而设计。这些图像由FLUX.2 [klein] 9B Base模型生成,并通过手动筛选确保至少具有良好的质量,如正确的解剖结构。数据集包含963个不同的提示和图像,以及39个编辑提示和图像,总计1002张图像。图像以无损压缩的JPEG XL格式存储。数据涵盖了广泛的类别,包括动物与生物、建筑、构图、动态姿势、手部、人类、景观、标志、物体、风格、英文文本等。此外,由于FLUX.2 [klein] 9B Base是一个编辑模型,数据集还包含带有参考图像和编辑结果的图像。技术参数包括1024x1024像素的原生分辨率、固定种子、50步采样、CGF=5.0、Euler采样器和简单调度器等。
创建时间:
2026-01-23
原始信息汇总
数据集概述
基本信息
- 数据集名称: FLUX.2 [klein] 9B Base samples
- 许可证: CC BY 4.0
- 任务类别: 文本到图像
- 主要语言: 英语
- 标签: LoRA, LyCROIS, LoKR, training, finetuning
- 数据规模: 1K < n < 10K
数据集描述
该数据集是一个高度多样化的高质量图像集合,由 FLUX.2 [klein] 9B Base 模型生成。
注意: 该基础模型并非用于图像生成,因此请勿使用这些图像来评判模型的质量。基础模型旨在用于训练,本数据集中的样本同样可用于正则化。
潜在用途
- 为基于 FLUX.2 [klein] 9B Base 的模型训练提供正则化图像
- 质量测试
数据来源
此数据集源自 stablellama/FLUX.2-klein-base-9B_samples,并经过人工筛选,仅包含至少具有良好质量(如正确解剖结构)的图像。
图像使用 ComfyUI 和 FLUX.2 [klein] 9B Base 的 fp8 版本 创建。每个提示生成了四张图像,但本数据集仅包含其中质量最高的图像。
生成参数如下:
- fp8: 已发布的完整模型权重
- 分辨率: 1024x1024 像素(1:1 宽高比图像的原生分辨率)
- 批次大小: 4(从该批次中选择最佳图像)
- 固定种子: 1
- 步数: 50(与 Black Forest Labs 在其 Huggingface 演示代码 中使用的一致)
- CGF: 5.0(与 Comfy UI 示例工作流 中使用的一致)
- 采样器: Euler
- 调度器: simple
数据内容
数据尝试涵盖非常广泛的概念,分类如下:
- 动物与生物(生物多样性): 80 张图像
- 建筑: 60 张图像
- 构图: 40 张图像
- DiffusionDB orig: 基于 DiffusionDB 提示,但经过 LLM 精炼,与 Qwen-Image-2512_samples 中使用的提示相同: 69 张图像
- DiffusionDB: 99 张图像
- 动态姿势: 80 张图像
- 手部: 80 张图像
- 人类: 80 张图像
- 景观: 20 张图像
- 标志,英文: 79 张图像
- 物体: 100 张图像
- 风格: 80 张图像
- 英文文本: 96 张图像
由于 FLUX.2 [klein] 9B Base 是一个编辑模型,因此也包含带有参考图像和编辑结果的数据:
- 编辑: 39 张图像
总计包含 963 个不同的提示和图像,以及 39 个编辑提示和图像。数据集总计 1002 张图像。
图像以无损压缩的 JPEG XL 格式存储。
搜集汇总
数据集介绍

构建方式
在文本到图像生成领域,数据集的构建质量直接影响模型训练的效果。FLUX.2-klein-base-9B_samples_Best_of数据集源自stablellama/FLUX.2-klein-base-9B_samples,经过人工筛选,仅保留解剖结构正确等高质量图像。图像通过ComfyUI平台,使用FLUX.2 [klein] 9B Base模型的fp8版本生成,每提示词生成四张图像,仅选取最佳图像纳入数据集。生成参数包括1024x1024像素分辨率、批次大小为4、固定种子、50步采样、CFG为5.0,采用Euler采样器和简单调度器,确保了数据的规范性与一致性。
特点
该数据集以其高度多样性和结构化分类而著称,涵盖动物与生物、建筑、构图、动态姿势、手部、人类、景观、标志、物体、风格及英文文本等十余个类别,总计1002张图像。特别值得注意的是,作为编辑模型的数据集,它包含了39张带有参考图像及编辑结果的样本,为图像编辑任务提供了宝贵资源。图像以无损压缩的JPEG XL格式存储,在保证视觉质量的同时优化了存储效率,使其成为训练和正则化任务的理想选择。
使用方法
该数据集主要应用于基于FLUX.2 [klein] 9B Base模型的训练正则化,通过提供高质量、多样化的图像样本,帮助提升模型在文本到图像生成任务中的泛化能力与稳定性。研究人员可将其用于质量测试,评估生成图像的解剖正确性和视觉保真度。使用时应遵循CC-BY-4.0许可协议,注意数据集中的图像并非直接用于评判基础模型生成质量,而是专注于训练支持,确保在合规范围内发挥其最大效用。
背景与挑战
背景概述
FLUX.2-klein-base-9B_samples_Best_of 数据集由 stablellama 团队于近期构建,专注于文本到图像生成领域。该数据集基于 Black Forest Labs 开发的 FLUX.2 [klein] 9B Base 模型生成,旨在为模型训练提供高质量、多样化的正则化图像样本。其核心研究问题在于解决生成式人工智能中模型微调与泛化能力提升的挑战,通过覆盖动物、建筑、动态姿态、文本等广泛概念类别,为后续研究提供了丰富的视觉素材基础,对推动图像生成模型的优化与稳定训练具有重要影响力。
当前挑战
该数据集主要应对生成式模型在训练过程中面临的过拟合与泛化不足等挑战,通过提供多样化的高质量图像,辅助模型在文本到图像任务中实现更稳定的输出。在构建过程中,挑战包括从原始生成批次中筛选出解剖结构正确、视觉质量优异的图像,确保样本在风格、主题和复杂度上的广泛覆盖,同时需处理图像格式转换与数据一致性维护等技术细节,以支持有效的正则化应用。
常用场景
经典使用场景
在生成式人工智能领域,高质量图像数据集对于模型训练与优化至关重要。FLUX.2-klein-base-9B_samples_Best_of数据集的核心应用场景在于为基于FLUX.2 [klein] 9B Base架构的模型提供正则化训练样本。该数据集通过精心筛选,涵盖了动物、建筑、人物动态姿势、文本生成等多元概念,其图像在解剖结构正确性与视觉质量上均经过严格把关,能够有效辅助模型在微调过程中避免过拟合,提升生成结果的稳定性和多样性。
解决学术问题
该数据集主要致力于解决生成式模型训练中的泛化能力与质量控制难题。在文本到图像生成任务中,模型常面临输出图像结构失真或风格单一的问题。通过提供涵盖广泛概念且质量统一的正则化样本,该数据集帮助研究者探索更高效的训练策略,如结合LoRA、LyCROIS等参数高效微调技术,从而在减少训练成本的同时,提升模型对复杂提示词的理解能力和输出图像的解剖学正确性,推动了生成模型鲁棒性研究的发展。
衍生相关工作
围绕该数据集,已衍生出多项聚焦于高效微调与质量评估的研究工作。例如,基于其构建的训练流程常与LoRA、LoKR等轻量级适配器技术结合,以探索在有限计算资源下提升FLUX.2系列模型性能的方法。此外,数据集的筛选机制——即从批量生成结果中选取最优样本——启发了关于生成模型自动质量评估与选择策略的研究,相关方法已被应用于构建更广泛的合成数据池,促进了生成式人工智能在数据增强与合成数据生成领域的应用。
以上内容由遇见数据集搜集并总结生成



