five

GenRef-wds, GenRef-CoT

收藏
github2025-04-24 更新2025-04-25 收录
下载链接:
https://github.com/Diffusion-CoT/ReflectionFlow
下载链接
链接失效反馈
官方服务:
资源简介:
GenRef-wds是完整GenRef的WebDataset格式数据集,GenRef-CoT是链式思考反思数据集。

GenRef-wds is a WebDataset-formatted dataset derived from the full GenRef corpus, while GenRef-CoT is a chain-of-thought reflection dataset.
创建时间:
2025-04-19
原始信息汇总

ReflectionFlow 数据集概述

数据集基本信息

数据集组成

主要数据集

名称 描述 链接
GenRef-wds WebDataset格式的完整GenRef数据集 HuggingFace
GenRef-CoT 包含Chain-of-Thought反思的数据集 HuggingFace

相关模型

核心模型

名称 描述 链接
FLUX Corrector 基于FLUX的校正模型 HuggingFace
Reflection Generator 基于Qwen的反思生成器 HuggingFace
Image Verifier 基于Qwen的图像验证器 HuggingFace

使用说明

环境配置

  1. 创建conda环境 bash conda create -n ReflectionFlow python=3.10 conda activate ReflectionFlow

  2. 安装依赖 bash pip install -r requirements.txt

训练配置

  • 配置文件: train_flux/config.yaml
  • 训练命令: bash bash train_flux/train.sh

推理配置

支持多种验证器和生成器配置,包括GPT-4o和NVILA-2B验证器。

引用信息

bibtex @misc{zhuo2025reflectionperfectionscalinginferencetime, title={From Reflection to Perfection: Scaling Inference-Time Optimization for Text-to-Image Diffusion Models via Reflection Tuning}, author={Le Zhuo and Liangbing Zhao and Sayak Paul and Yue Liao and Renrui Zhang and Yi Xin and Peng Gao and Mohamed Elhoseiny and Hongsheng Li}, year={2025}, eprint={2504.16080}, archivePrefix={arXiv}, primaryClass={cs.CV}, url={https://arxiv.org/abs/2504.16080}, }

搜集汇总
数据集介绍
main_image_url
构建方式
GenRef-wds和GenRef-CoT数据集的构建基于文本到图像扩散模型的推理时优化技术,通过反射调优(Reflection Tuning)方法实现。数据集以WebDataset格式存储,包含完整的GenRef数据以及链式思维(Chain-of-Thought)反射数据。构建过程中,研究人员采用了多模态模型(如Qwen和FLUX)生成和验证图像,确保数据的高质量和多样性。数据集的构建还结合了GPT-4o和NVILA等先进模型的能力,以支持复杂的推理和验证任务。
特点
GenRef-wds和GenRef-CoT数据集的特点在于其专注于文本到图像生成任务的推理时优化。数据集不仅包含高质量的图像生成样本,还提供了链式思维反射数据,帮助模型在生成过程中进行自我优化。数据集支持多种模型配置,包括FLUX校正器、反射生成器和图像验证器,能够满足不同研究需求。此外,数据集的设计注重可扩展性,支持从少量样本到大规模数据的灵活应用,为研究人员提供了丰富的实验资源。
使用方法
使用GenRef-wds和GenRef-CoT数据集时,研究人员需先配置环境并安装相关依赖。数据集可通过HuggingFace平台直接下载或通过URL流式加载。训练FLUX校正器时,用户需修改配置文件以指定数据路径和训练参数。推理时,数据集支持多种模型组合,如GPT-4o、NVILA和自定义反射生成器。用户可通过提供的脚本生成基线结果,并进一步进行噪声缩放和反射调优实验。数据集还包含验证器过滤功能,帮助筛选高质量生成样本。
背景与挑战
背景概述
GenRef-wds与GenRef-CoT数据集由香港中文大学多媒体实验室(CUHK MMLAB)、KAUST、Hugging Face及上海人工智能实验室等机构联合研发,于2025年4月正式发布,作为ReflectionFlow框架的核心数据支撑。该数据集聚焦于文本到图像扩散模型的推理时优化问题,通过引入反思调谐(Reflection Tuning)机制,旨在提升生成图像的质量与语义一致性。其创新性在于构建了包含链式思考(Chain-of-Thought)标注的反思数据集,为扩散模型在推理阶段实现动态计算资源分配提供了理论基础与实践范式,对生成式人工智能领域的模型优化方向具有重要启发意义。
当前挑战
在领域问题层面,GenRef数据集需解决文本到图像生成中语义对齐不足与计算资源低效利用的双重挑战,尤其在多轮反思迭代过程中,如何平衡生成质量与计算开销成为关键难题。数据构建过程中,研究者面临标注复杂性高的问题:链式思考数据需人工标注与模型协同生成结合,且需确保反思逻辑的连贯性;此外,大规模多模态数据(文本-图像对)的清洗与标准化处理亦消耗大量算力,部分噪声数据可能导致反思生成模块的误差累积。
常用场景
经典使用场景
在生成式人工智能领域,GenRef-wds和GenRef-CoT数据集为研究者提供了丰富的资源,特别适用于文本到图像生成模型的推理时优化研究。这些数据集通过链式思考(Chain-of-Thought)和反射调优(Reflection Tuning)技术,帮助模型在生成过程中进行自我修正和优化,从而提升生成图像的质量和一致性。
解决学术问题
GenRef数据集解决了生成式模型在推理时优化中的关键问题,如噪声控制和提示词优化。通过引入反射调优技术,数据集为模型提供了自我评估和修正的能力,显著提升了生成结果的准确性和多样性。这一技术不仅推动了文本到图像生成领域的发展,还为其他生成任务提供了新的研究思路。
衍生相关工作
GenRef数据集衍生了一系列经典工作,如FLUX Corrector模型和Reflection Generator模型。这些工作进一步扩展了反射调优技术的应用范围,并在噪声控制、提示词优化等方面取得了显著成果。相关研究不仅推动了生成式模型的发展,还为多模态学习提供了新的研究方向。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作