REDEdit-Bench
收藏REDEdit-Bench 数据集概述
基本信息
- 数据集名称: RedBench (REDEdit-Bench)
- 发布方: FireRedTeam
- 许可证: Creative Commons Attribution–NonCommercial–NoDerivatives 4.0 (CC BY-NC-ND 4.0)
- 语言: 中文、英文
- 数据规模: 1,542 个双语(中文-英文)编辑对
- 技术报告: https://arxiv.org/abs/2602.13344
- GitHub 代码库: https://github.com/FireRedTeam/FireRed-Image-Edit
- 数据集下载地址: https://huggingface.co/datasets/FireRedTeam/REDEdit-Bench/resolve/main/REDEdit_Bench.tar?download=true
数据集简介
RedBench 是一个综合性基准测试,旨在评估当前图像编辑模型的能力。其主要目标是构建更多样化的场景和更符合人类语言的编辑指令。数据集从互联网收集了超过 3,000 张图像,经过专家精心筛选,最终构建了涵盖 15 个类别 的 1,542 个双语编辑对。
关于数据规模的说明:论文中描述的原始基准测试包含 1,673 个图像对。但由于某些商业资产的严格再分发许可限制,公开发布版本已整理为 1,542 对,以确保完全遵守版权法,同时保持基准测试的多样性和质量。
核心特征
- 人类对齐的指令:多样化的场景和编辑指令,紧密模拟真实世界的人类使用情况。
- 双语支持:完整支持中文和英文编辑指令。
- 质量保证:从大量源图像收集中由专家精心策划。
- 多样化任务:涵盖 15 个不同的类别。
数据结构与任务类别
数据集采用 JSONL 格式组织。每个条目包含图像源、双语指令和具体的任务类别。
任务类别分布
| 类别 | 数量 | 描述 |
|---|---|---|
| add | 143 | 对象添加 |
| adjust | 156 | 属性调整 |
| background | 91 | 背景修改 |
| beauty | 79 | 美颜增强 |
| color | 99 | 颜色修改 |
| compose | 100 | 图像合成 |
| extract | 95 | 元素提取 |
| lowlevel | 47 | 低级处理 |
| motion | 78 | 运动添加 |
| portrait | 102 | 人像编辑 |
| remove | 147 | 对象移除 |
| replace | 140 | 对象替换 |
| stylize | 92 | 风格迁移 |
| text | 123 | 文本编辑 |
| viewpoint | 50 | 视角改变 |
| all | 1542 | 所有任务 |
数据示例
json {"id": "1", "source": "redbench/add/add-1.png", "a_to_b_instructions": "在图片中绿色植物上增加一只七星瓢虫", "a_to_b_instructions_eng": "Add a seven-spotted ladybug on the green plant in the picture", "task": "add"} {"id": "2", "source": "redbench/add/add-2.png", "a_to_b_instructions": "在咖啡杯里加一个白色心形拉花", "a_to_b_instructions_eng": "Add a white heart-shaped latte art in the coffee cup", "task": "add"}
使用流程
1. 图像生成
在使用模型进行评估之前,需要先使用提供的 JSONL 文件(包含元数据信息)和原始图像文件,通过编辑模型生成相应的编辑后图像。
依赖安装: bash pip install accelerate diffusers transformers pillow tqdm
下载数据集: 请下载 tar 文件并解压:https://huggingface.co/datasets/FireRedTeam/REDEdit_Bench/resolve/main/REDEdit_Bench.tar?download=true
推理脚本:
使用 redbench_infer.py 脚本,支持使用 Accelerate 进行多 GPU 分布式推理。
主要参数:
--model-path: 模型路径,默认为FireRedTeam/FireRed-Image-Edit-1.0--jsonl-path: 包含编辑指令的 JSONL 文件路径(必需)--save-path: 保存生成图像的目录(必需)--edit-task: 要处理的特定任务,默认为all--lang: 指令语言,cn 或 eng,默认为 cn
2. 图像编辑评估
使用 Gemini-3-Flash API 评估图像编辑过程。系统根据预定义的标准集(如指令遵循、图像编辑质量、细节保留)处理一组原始图像和编辑后的图像。
依赖安装: bash pip install google-generativeai pillow tqdm
环境设置: 设置 Gemini API 密钥环境变量: bash export GEMINI_API_KEY="your-gemini-api-key"
评估脚本:
使用 redbench_eval.py 脚本进行自动化评估。
主要参数:
--result_img_folder: 包含编辑后图像的目录(必需)--edit_json: 包含编辑指令和元数据的 JSONL 文件路径(必需)--prompts_json: 包含每个任务类别评估提示的 JSON 文件路径(必需)--lang: 指令语言,cn 或 eng,默认为 cn
评估标准(按任务类别)
| 任务类别 | 评估指标 |
|---|---|
| add, remove, replace, compose, extract | 提示符合度、视觉无缝性、物理与细节保真度 |
| adjust, color, lowlevel | 提示符合度、视觉无缝性、物理与细节保真度 |
| background, viewpoint | 提示符合度、视觉无缝性、物理与细节保真度 |
| beauty, portrait | 提示符合度、视觉无缝性、物理与细节保真度 |
| stylize | 风格保真度、内容保留、渲染质量 |
| motion | 提示符合度、运动真实感、视觉无缝性 |
| text | 文本保真度、视觉一致性、背景保留 |
输出结果
评估脚本自动计算并保存结果:
result.json- 每张图像的详细评估。score.json- 最终分数,包括每个类别的平均值和总体分数。
许可与引用
- 许可证: Creative Commons Attribution–NonCommercial–NoDerivatives 4.0 (CC BY-NC-ND 4.0)
- 允许用途: 仅限学术研究目的
- 禁止用途: 商业用途
- 数据来源: 所有图像均通过官方渠道合法购买和获取,以确保版权合规。
引用格式: bibtex @article{firered2026rededit, title={FireRed-Image-Edit-1.0 Technical Report}, author={Super Intelligence Team}, year={2026}, archivePrefix={arXiv}, primaryClass={cs.CV}, url={https://arxiv.org/abs/2602.13344}, }



