GPT-IMAGE-EDIT-1.5M
收藏GPT-Image-Edit 数据集概述
数据集基本信息
- 名称: GPT-Image-Edit-1.5M
- 发布者: UCSC-VLAA
- 发布时间: 2025年7月27日
- 数据规模: 150万高质量图像编辑样本
- 存储需求: 5TB
- 数据地址: https://huggingface.co/datasets/UCSC-VLAA/GPT-Image-Edit-1.5M
数据集内容
- 组成部分:
- 源图像
- 标注元数据(JSON格式文件)
- 数据格式:
- 每行包含三列:
- 图像根路径
- 对应标注JSON文件
- 是否启用区域加权策略(默认为False)
- 每行包含三列:
训练数据准备
-
数据文件示例:
data/gpt-edit/hqedit/edit,training_json/hqedit_gpt_edit.json,false data/gpt-edit/hqedit/generate,training_json/hqedit_gpt_generate.json,false data/gpt-edit/omniedit,training_json/omniedit_gpt.json,false data/gpt-edit/omniedit,training_json/omniedit_gpt_rewrite.json,false data/gpt-edit/omniedit/complex-edit,training_json/complexedit_gpt.json,false data/gpt-edit/ultraedit,training_json/ultraedit_gpt.json,false
性能表现
GEdit-EN-full 基准测试
| 指标 | BG Change | Color Alt. | Mat. Mod. | Motion | Portrait | Style | Add | Remove | Replace | Text | Tone | Avg |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 得分 | 7.80 | 7.54 | 7.12 | 7.75 | 7.09 | 6.74 | 8.04 | 7.95 | 7.17 | 5.45 | 6.95 | 7.24 |
Complex-Edit 基准测试
| 指标 | IF | IP | PQ | Overall |
|---|---|---|---|---|
| 得分 | 8.99 | 8.41 | 8.93 | 8.78 |
ImgEdit-Full 基准测试
| 指标 | Add | Adjust | Extract | Replace | Remove | Background | Style | Hybrid | Action | Overall |
|---|---|---|---|---|---|---|---|---|---|---|
| 得分 | 4.07 | 3.79 | 2.04 | 4.13 | 3.89 | 3.90 | 4.84 | 3.04 | 4.52 | 3.80 |
相关资源
- 预训练模型: UCSC-VLAA/gpt-image-edit-training
- 技术报告: arXiv:2507.21033
- 基础框架: UniWorld-V1
许可信息
- 许可证: 详见LICENSE
- FLUX Kontext权重: 遵循FLUX.1 Kontext [dev] Non-Commercial License
引用格式
bibtex @misc{wang2025gptimageedit15mmillionscalegptgeneratedimage, title={GPT-IMAGE-EDIT-1.5M: A Million-Scale, GPT-Generated Image Dataset}, author={Yuhan Wang and Siwei Yang and Bingchen Zhao and Letian Zhang and Qing Liu and Yuyin Zhou and Cihang Xie}, year={2025}, eprint={2507.21033}, archivePrefix={arXiv}, primaryClass={cs.CV}, url={https://arxiv.org/abs/2507.21033}, }




