X2Edit-Dataset
收藏X2Edit数据集概述
数据集基本信息
- 任务类型: 图像编辑(image editing)
- 许可证: Apache-2.0
- 特点: 覆盖14种多样化的编辑任务,相比现有开源数据集(AnyEdit/HQ-Edit/UltraEdit等)具有显著优势
数据统计
各模型构建数据量
| 模型 | 数据量 |
|---|---|
| Bagel | 502K |
| GPT-4o | 232K |
| Kontext | 2.2M |
| Step1X-Edit | 900K |
| LaMa | 200K |
| OmniConsistency | 250K |
| TextFlux | 280K |
数据结构
目录结构
X2Edit-data/ ├── bagel/ │ ├── 0/ │ ├── 00000.tar │ ├── 000000.1.0.jpg # 原始图像 │ ├── 000000.2.0.jpg # 编辑后图像 │ ├── 000000.json # 元信息 │ ├── 000000.txt # 编辑指令 └── textflux/ ├── 0/ ├── 00000.tar ├── 000000.1.0.jpg # 原始图像 ├── 000000.1.1.jpg # 文本前景掩码 ├── 000000.2.0.jpg # 编辑后图像 ├── 000000.json # 元信息 ├── 000000.txt # 编辑指令
JSON格式
通用字段
json { "caption_en": "英文描述", "caption_zh": "中文描述", "instruction": "编辑指令(中/英)", "instruction_zh": "中文编辑指令", "task": "任务类型", "model": "数据构建模型", "score_7b": "Qwen2.5-7B评分", "liqe_score": "原始图像liqe分数", "liqe_score_edit": "编辑图像liqe分数", "aesthetic_score_v2_5": "原始图像美学评分", "aesthetic_score_v2_5_edit": "编辑图像美学评分" }
特殊字段
- step1x-edit: 包含Qwen2.5-72B评分
- kontext_subject: 包含DINOv2/CLIP评分
- textflux: 包含文本框坐标信息
使用指南
下载方式
bash git lfs install git clone https://www.modelscope.cn/datasets/zhuxujie/X2Edit-Dataset.git
数据加载示例
提供基于PyTorch的数据加载代码示例,支持多进程读取和批量处理。
致谢
感谢以下项目的贡献:
- FLUX.1-Kontext-dev
- Step1X-Edit
- Bagel
- GPT-4o
- LaMa
- TextFlux
- OmniConsistency




