OneIG-Bench
收藏OneIG-Bench 数据集概述
基本信息
- 许可证: CC-BY-NC-4.0
- 任务类别: 文本生成图像 (text-to-image)
- 配置:
- OneIG-Bench: OneIG-Bench.json
- OneIG-Bench-ZH: OneIG-Bench-ZH.json
数据集简介
OneIG-Bench 是一个用于全面评估文本生成图像(T2I)模型的基准框架,涵盖多个维度:
- 主题元素对齐
- 文本渲染精度
- 推理生成内容
- 风格化
- 多样性
关键贡献
- 包含六个提示集,前五个(245个动漫与风格化、244个肖像、206个通用对象、200个文本渲染和225个知识与推理提示)提供中英文版本,200个多语言提示。
- 开发了系统化的定量评估方法,通过标准化指标进行客观能力排名。
- 评估了最先进的开源方法和专有模型。
数据集结构
OneIG-Bench 格式
json { "category": "Anime_Stylization", # 提示类别 "id": "095", # 唯一标识符 "prompt_en": "{prompt}", # 英文提示 "type": "NP", # 提示类型(如 NP 或 T,P) "prompt_length": "long", # 提示长度(如 short, middle, long) "class": "impasto" # 风格(动漫与风格化)、形式(文本渲染)、主题(知识与推理) }
OneIG-Bench-ZH 格式
- 是 OneIG-Bench 的简化版本,省略了 type 和 prompt_length 字段。
使用指南
图像生成
- 每个提示生成4张图像,合并为一张图像。
- 图像按类别保存到子文件夹:anime、human、object、text、reasoning、multilingualism。
- 文件名应遵循 OneIG-Bench.json 或 OneIG-Bench-ZH.json 中的 id。
评估
- 参数配置:
mode: 选择 EN 或 ZH。image_dir: 存储生成图像的目录。model_names: 要评估的模型名称。image_grid: 每个提示生成的图像数量。class_items: 要评估的提示类别或图像集。
结果
评估指标与图像集对应关系
| 对齐 | 文本 | 推理 | 风格 | 多样性 | |
|---|---|---|---|---|---|
| OneIG-Bench | O, P, A, S | T | KR | S | O, P, A, S, T, KR |
| OneIG-Bench-ZH | O_zh, P_zh, A_zh, S_zh, L_zh | T_zh | KR_zh | S_zh | O_zh, P_zh, A_zh, S_zh, L_zh, T_zh, KR_zh |
引用
bibtex @article{chang2025oneig, title={OneIG-Bench: Omni-dimensional Nuanced Evaluation for Image Generation}, author={Jingjing Chang and Yixiao Fang and Peng Xing and Shuhan Wu and Wei Cheng and Rui Wang and Xianfang Zeng and Gang Yu and Hai-Bao Chen}, journal={arXiv preprint arxiv:2506.07977}, year={2025} }
致谢
感谢 Qwen、CLIP、CSD_Score、DreamSim 和 HuggingFace 团队的贡献。




