ImagenWorld-annotated-set
收藏ImagenWorld – Annotated Set 数据集概述
数据集简介
ImagenWorld是一个大规模基准数据集,旨在评估真实多模态场景下的图像生成和编辑模型。该数据集涵盖六个任务和六个领域,为评估模型组合性、指令遵循和多模态推理提供统一框架。
数据集内容
- 标注集:包含模型生成输出的人工评估结果
- 数据划分:包含train和test两个划分
- train划分包含人工标注
- test划分仅包含剩余部分,无人工评估
数据集结构
目录结构
ImagenWorld-annotated-set/ ├── train/ │ ├── TIG.zip │ ├── TIE.zip │ ├── SRIG.zip │ ├── SRIE.zip │ ├── MRIG.zip │ └── MRIE.zip ├── test/ │ ├── TIG.zip │ ├── TIE.zip │ ├── SRIG.zip │ ├── SRIE.zip │ ├── MRIG.zip │ └── MRIE.zip
train划分结构(含人工评估)
TIG/ └── TIG_A_000001/ ├── input/ │ ├── metadata.json │ ├── 1.png │ └── ... └── outputs/ ├── sdxl/ │ ├── annotator1/ │ │ ├── evaluation.json │ │ ├── error_mask.png │ │ └── ... │ ├── annotator2/ │ ├── annotator3/ │ ├── out.png │ ├── som_segments.png │ └── som_segments.npz └── gpt-image-1/ ├── ...
test划分结构(无人工评估)
TIG/ └── TIG_A_000001/ ├── input/ └── outputs/ ├── sdxl/ │ ├── out.png │ ├── som_segments.png │ └── som_segments.npz └── gpt-image-1/
文件描述
| 文件 | 描述 |
|---|---|
| evaluation.json | 包含标注者反馈和每个对象或片段的评分 |
| error_mask.png | 二进制掩码,突出显示错误生成的区域 |
| som_segments.png | Set-of-Marks模型生成的视觉分割图 |
| som_segments.npz | 包含与som_segments.png对应的像素到片段映射的NumPy数组 |
| out.png | 模型为此条件集生成的原始图像 |
| metadata.json | 原始条件集的输入元数据和提示 |
标注细节
- 每个模型输出由三名独立标注者进行评估
- 标注者可以选择:
- None:未发现错误
- All:整个图像存在严重问题
- 或使用错误掩码标记特定区域
- 评估包括对象级、片段级和基于分数的评分
相关数据集
| 组件 | 描述 | 仓库地址 |
|---|---|---|
| Condition Set | 输入提示和参考图像 | https://huggingface.co/datasets/TIGER-Lab/ImagenWorld |
| Model Outputs | 评估中使用的所有模型生成的图像 | https://huggingface.co/datasets/TIGER-Lab/ImagenWorld-model-outputs |
注意事项
- train划分包含多人标注者的人工标注
- test划分不包含人工评估
- 所有模型均包含分割文件以支持错误定位和结构化比较




