GDB: GraphicDesignBench
收藏GDB: GraphicDesignBench 数据集概述
数据集简介
GDB (GraphicDesignBench) 是一个用于评估视觉-语言模型在专业平面设计任务上性能的基准测试套件。它涵盖布局推理、排版、SVG编辑、模板匹配和动画等多个任务领域。该数据集基于Lica数据集构建,包含1,148个真实设计布局。
核心信息
- 论文:arXiv:2604.04192
- 数据集地址:https://huggingface.co/datasets/lica-world/GDB
- 博客介绍:https://lica.world/blog/gdb-real-world-benchmark-for-graphic-design
- 许可证:Apache 2.0
基准测试结构
数据集包含39个基准测试,分布在7个任务领域,每个任务分为理解或生成两类。
| 领域 | 任务数量 | 基准测试数量 | 描述 |
|---|---|---|---|
| 类别 | 2 | 2 | 设计类别分类和用户意图预测 |
| 布局 | 8 | 8 | 设计画布的空间推理(宽高比、元素计数、组件类型和检测)、布局生成(意图到布局、部分完成、宽高比适应)以及图层感知的对象插入 |
| Lottie动画 | 2 | 2 | 从文本和图像生成Lottie动画 |
| SVG | 8 | 8 | SVG推理和编辑(感知和语义问答、错误修复、优化、样式编辑)以及生成(文本到SVG、图像到SVG、组合输入) |
| 模板 | 5 | 5 | 模板匹配、检索、聚类和生成(样式完成、颜色迁移) |
| 时序 | 8 | 6 | 关键帧排序;运动类型分类;视频/组件持续时间和开始时间估计;生成(动画参数、运动轨迹、短视频) |
| 排版 | 12 | 8 | 字体族、颜色、大小/粗细/对齐/字间距/行高、样式范围、曲率、旋转以及生成(样式化文本元素、样式化文本渲染到布局) |
数据组织
本地数据包解压后的结构如下:
gdb-dataset/ ├── lica-data/ # 核心Lica数据(布局、渲染图、元数据) │ ├── metadata.csv # 每个布局一行 │ ├── layouts/<template_id>/<layout_id>.json │ ├── images/<template_id>/<layout_id>.{png,jpg,webp,mp4} │ └── annotations/… # 可选注释 │ └── benchmarks/ # 按领域划分的评估输入 ├── category/ # CategoryClassification/, UserIntentPrediction/ ├── image/ ├── layout/ ├── lottie/ ├── svg/ ├── template/ ├── temporal/ # KeyframeOrdering/, MotionTypeClassification/等 └── typography/
获取方式
- 在线加载:通过HuggingFace Hub直接加载(无需下载)
- 本地下载:运行
python scripts/download_data.py下载到本地data/gdb-dataset/目录
评估支持
模型提供商支持
| 提供商 | CLI标志 |
|---|---|
| OpenAI | --provider openai |
| Anthropic | --provider anthropic |
| Gemini | --provider gemini |
| HuggingFace | --provider hf --device auto |
| vLLM | --provider vllm |
| Diffusion | --provider diffusion |
| OpenAI Image | --provider openai_image |
| 自定义入口点 | --provider custom --custom-entry module:attr |
评估指标扩展
| 扩展包 | 功能 |
|---|---|
.[metrics] |
scipy, sklearn, scikit-image, Pillow, cairosvg |
.[svg-metrics] |
增加 torch, transformers, lpips |
.[lottie-metrics] |
增加 rlottie-python |
.[layout-metrics] |
增加 pyiqa, hpsv2, hpsv3, dreamsim, image-reward(需Linux + Python < 3.12) |
集成支持
- HELM框架:可通过Stanford CRFM的HELM框架运行所有39个基准测试
引用格式
bibtex @article{gdb2026, title={GDB: A Real-World Benchmark for Graphic Design}, author={Deganutti, Adrienne and Hirsch, Elad and Zhu, Haonan and Seol, Jaejung and Mehta, Purvanshi}, journal={arXiv preprint arXiv:2604.04192}, year={2026} }




