OneIG-Bench
收藏OneIG-Bench数据集概述
基本信息
- 数据集名称:OneIG-Bench: Omni-dimensional Nuanced Evaluation for Image Generation
- 发布日期:2025年6月10日
- 发布机构:上海交通大学、StepFun
- 相关资源:
数据集简介
OneIG-Bench是一个用于全面评估文本到图像(T2I)模型的多维度基准测试框架,主要关注以下维度:
- 主题元素对齐
- 文本渲染精度
- 推理生成内容
- 风格化
- 多样性
关键贡献
-
提示集设计:
- 包含6个提示集,共计1320个提示(英文和中文各660个)
- 具体分类:
- 动漫与风格化(245个)
- 肖像(244个)
- 通用对象(206个)
- 文本渲染(200个)
- 知识与推理(225个)
- 多语言(200个)
-
系统化评估框架:
- 提供标准化评估指标
- 支持按维度灵活选择评估
数据集结构
-
图像存储结构: bash 📁 images/ ├── 📂 anime/ # 动漫与风格化 ├── 📂 human/ # 肖像 ├── 📂 object/ # 通用对象 ├── 📂 text/ # 文本渲染 ├── 📂 reasoning/ # 知识与推理 └── 📂 multilingualism/ # 多语言
-
文件命名:
- 使用提示ID作为文件名(如000.webp)
评估指标
-
主要评估维度:
- 对齐度(Alignment)
- 文本(Text)
- 推理(Reasoning)
- 风格(Style)
- 多样性(Diversity)
-
评估脚本: shell run_overall.sh # 全部指标 run_alignment.sh # 对齐度 run_diversity.sh # 多样性 run_reasoning.sh # 推理 run_style.sh # 风格 run_text.sh # 文本
引用信息
bibtex @article{chang2025oneig, title={OneIG-Bench: Omni-dimensional Nuanced Evaluation for Image Generation}, author={Jingjing Chang and Yixiao Fang and Peng Xing and Shuhan Wu and Wei Cheng and Rui Wang and Xianfang Zeng and Gang Yu and Hai-Bao Chen}, journal={arXiv preprint arxiv:2506.07977}, year={2025} }




