GDB

Hugging Face2026-04-24 更新2026-04-25 收录

下载链接：

https://huggingface.co/datasets/lica-world/GDB

下载链接

链接失效反馈

官方服务：

资源简介：

GDB（GraphicDesignBench）是一个用于评估视觉语言模型在平面设计任务上性能的多模态基准数据集。该数据集包含39个不同的基准测试，涵盖布局、排版、SVG、模板匹配和动画等多个设计领域，基于1,148个来自Lica数据集的真实设计布局构建。数据集适用于视觉问答、图像到文本和文本到图像等任务，支持理解和生成两种任务类型。数据集中每个样本包含样本ID、基准ID、领域、任务类型、提示、真实答案、图像（如适用）和元数据等字段。数据集规模介于1,000到10,000个样本之间，采用Apache 2.0许可协议发布。

创建时间：

2026-04-13

原始信息汇总

GDB: GraphicDesignBench 数据集概述

基本信息

数据集名称: GDB (GraphicDesignBench)
许可证: Apache-2.0
语言: 英语
数据规模: 1,000 < n < 10,000
数据集页面: https://huggingface.co/datasets/lica-world/GDB
论文: https://arxiv.org/abs/2604.04192
代码仓库: https://github.com/lica-world/GDB
博客: https://lica.world/blog/gdb-real-world-benchmark-for-graphic-design

任务类型

该数据集支持以下任务：

视觉问答（visual-question-answering）
图像到文本（image-to-text）
文本到图像（text-to-image）

数据来源与构成

基于 1,148 个真实设计布局，来源于 Lica dataset
共包含 39 个基准测试，覆盖平面设计领域的多个子任务

领域与子任务

数据集涵盖以下 7 个领域：

领域	说明
layout	布局设计
typography	排版设计
svg	SVG 图形设计
template	模板匹配
temporal	时序/动画设计
category	分类任务
lottie	Lottie 动画设计

每个任务包含 理解（understanding） 或 生成（generation） 两种类型。

数据配置（Configs）

数据集共包含 38 个配置，每个配置对应一个独立的基准测试子集，所有配置均仅有 训练集（train）：

Layout 领域（8 个配置）

layout-1 至 layout-8

Typography 领域（8 个配置）

typography-1 至 typography-8

SVG 领域（8 个配置）

svg-1 至 svg-8

Template 领域（5 个配置）

template-1 至 template-5

Temporal 领域（6 个配置）

temporal-1 至 temporal-6

Category 领域（2 个配置）

category-1、category-2

Lottie 领域（2 个配置）

lottie-1、lottie-2

数据样例结构

每条数据包含以下字段：

字段	类型	说明
`sample_id`	string	样本唯一标识
`benchmark_id`	string	基准测试 ID，如 `svg-1`、`typography-3`
`domain`	string	所属领域
`task_type`	string	任务类型：`understanding` 或 `generation`
`prompt`	string	评测提示文本
`ground_truth`	string	正确答案（复杂类型以 JSON 格式存储）
`image`	Image	输入图像（如有）
`metadata`	string	任务特定元数据（JSON 格式）

使用方式

加载数据

python from datasets import load_dataset ds = load_dataset("lica-world/GDB", "svg-1")

评测方式

bash pip install git+https://github.com/lica-world/GDB.git

python from gdb.registry import BenchmarkRegistry registry = BenchmarkRegistry() registry.discover() bench = registry.get("svg-1") scores = bench.evaluate(predictions, ground_truth)

引用

bibtex @article{gdb2026, title={GDB: A Real-World Benchmark for Graphic Design}, author={Deganutti, Adrienne and Hirsch, Elad and Zhu, Haonan and Seol, Jaejung and Mehta, Purvanshi}, journal={arXiv preprint arXiv:2604.04192}, year={2026} }

搜集汇总

数据集介绍

构建方式

GDB（GraphicDesignBench）数据集源于对图形设计领域系统性评估的迫切需求，旨在填补现有视觉语言模型在真实设计任务中缺乏标准化基准的空白。该数据集基于Lica数据集中的1,148个真实设计布局构建，通过精细的任务划分，生成了涵盖布局、排版、SVG、模板匹配与动画等五大核心设计领域的39项独立基准测试。每个基准点均定义了明确的提示词（prompt）与标准答案（ground_truth），并区分了理解型与生成型两种任务类型，从而为模型能力的多维度量化提供了坚实的数据基础。

特点

GDB数据集的核心特色在于其高度的专业性与综合性。它超越了传统视觉问答的范畴，深入至图形设计的专业领域，囊括了如SVG代码解析、版式层级识别、动态Lottie动画理解等复杂任务。数据集内每一子基准（如typography-1、svg-3）均聚焦于特定设计能力，形成了从视觉感知到语义解析的完整测试谱系。此外，其结构化的元数据（metadata）支持任务特定字段的灵活扩展，确保了评估过程的可解释性与精确性，使之成为衡量多模态模型设计素养的权威标尺。

使用方法

使用GDB数据集进行模型评估的流程高度标准化且便捷。研究人员可通过Hugging Face的`datasets`库直接加载指定的子基准配置，例如执行`load_dataset("lica-world/GDB", "svg-1")`即可获得针对SVG理解任务的测试集。对于完整的评测管线，建议安装官方提供的评估库，并利用`BenchmarkRegistry`模块自动发现与加载所有基准。用户只需将模型预测结果与标准答案（ground_truth）传入相应基准的`evaluate`函数，即可获得结构化的评分报告，从而高效地对比不同模型在图形设计任务上的表现。

背景与挑战

背景概述

平面设计作为视觉传达的核心手段，其自动化评估长期受限于缺乏标准化、多维度及真实场景的基准数据集。在此背景下，GDB（GraphicDesignBench）于2026年由Adrienne Deganutti、Elad Hirsch、Haonan Zhu、Jaejung Seol及Purvanshi Mehta等研究人员联合构建，依托Lica数据集中的1,148个真实设计布局，系统性地覆盖了布局、排版、SVG、模板匹配与动画五大核心设计领域。该数据集旨在填补多模态大语言模型在平面设计任务中评估体系的空白，通过39个精细划分的基准测试，为视觉语言模型在理解与生成两方面提供可量化、可复现的评测标准。其发布标志着平面设计领域从主观审美评判向客观计算评估的重要跨越，为相关研究提供了坚实的实证基础。

当前挑战

GDB致力于应对平面设计领域多个层次的挑战。在领域问题层面，平面设计任务具有高度主观性与视觉复杂性，传统自然语言处理或图像分类基准难以刻画设计意图与美学规则的细微差异，GDB通过结构化任务（如SVG语义解析、模板精确匹配）将抽象设计问题转化为可计算评估的标准化挑战，从而推动多模态模型向更精细的视觉推理能力演进。在构建过程中，团队面临标注一致性与多样性间的矛盾：需为不同设计领域（如动态动画Lottie、静态排版Typography）统一任务定义与答案格式，同时确保1,148个真实布局样本能覆盖设计模块的复杂组合。此外，生成任务（如根据提示输出布局属性）的自动化评估缺乏通用指标，GDB通过引入结构化地面真值JSON及分区评测框架，平衡了评估的严谨性与任务类型的灵活性。

常用场景

经典使用场景

在视觉语言模型迅猛发展的当下，平面设计作为视觉传达的核心领域，亟需专门的评测基准来检验模型对设计元素的感知与生成能力。GDB（GraphicDesignBench）数据集应运而生，它基于1,148个真实世界设计布局构建，涵盖排版、SVG图形、模板匹配、动画与分类等39项精细化任务。该数据集最经典的用途是作为多模态模型的标准化评测平台，研究者通过提示词驱动模型完成理解或生成任务，并将输出与标准答案进行对比，从而量化模型在平面设计各维度的表现。无论是评估模型对字体排印细节的辨识力，还是检验其从自然语言生成结构化SVG的能力，GDB都提供了系统化的测试框架。

实际应用

在产业实践中，GDB数据集成为检验AI辅助设计工具性能的关键标尺。设计平台可将该基准用于内部模型评测，确保自动排版建议、SVG图标生成、视频动画转换等功能的可靠性与审美一致性。广告公司与内容创意团队利用GDB筛选出的高性能视觉语言模型，来加速宣传物料、社交媒体模板与品牌视觉系统的批量制作。此外，教育研究机构也能借助该数据集培养学生对设计美学的量化理解，辅助设计自动化课程的实验设计。从智能海报生成到交互式动效设计，GDB为设计领域的AI落地提供了从理论验证到产品部署的衔接桥梁，推动技术真正融入创意工作流。

衍生相关工作

GDB数据集的诞生催生了诸多富有启发性的后续工作。研究者以其为评测杠杆，深入探索适用于设计任务的多模态架构，例如构建专门针对排版识别与SVG结构生成的定制化视觉语言模型。围绕数据集中的动画子集，衍生出关于Lottie格式动态设计的理解与生成研究。部分工作聚焦于模板匹配任务的改进，推动了少样本学习在设计检索中的应用。更广泛的引申研究还包括将GDB的评测范式拓展到UI界面设计、品牌标识生成等关联领域，以及开发更精细化的设计质量评估指标。这些衍生工作共同构建起以GDB为核心的平面设计AI研究生态，持续推动着模型从“理解画面”向“理解设计”的认知跃迁。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集