CreativePSD
收藏arXiv2026-03-27 更新2026-03-28 收录
下载链接:
https://henghuiding.com/PSDesigner/
下载链接
链接失效反馈官方服务:
资源简介:
CreativePSD是由复旦大学和南洋理工大学联合构建的PSD格式专业设计数据集,包含10,454个高质量设计文件,覆盖多样化设计场景与艺术风格。该数据集通过三阶段流程构建:首先收集互联网及付费PSD文件并按视觉概念分组,随后解析图层层次结构并提取原始素材、元数据及中间渲染结果,最终转化为工具调用训练数据以支持Xgen(资产整合)和Xedt(图层优化)两种设计模式。其平均每样本含48.35个图层,支持超过60种属性类型,显著超越现有设计数据集复杂度,为自动化设计系统PSDesigner提供专业工作流程学习基础,助力非专业人士高效生成生产级设计作品。
提供机构:
复旦大学·计算机科学与人工智能学院大数据研究所; 南洋理工大学·计算与数据科学学院生成式人工智能实验室
创建时间:
2026-03-27
原始信息汇总
PSDesigner: Automated Graphic Design with a Human-Like Creative Workflow
数据集概述
- 数据集名称: CreativePSD
- 所属系统: PSDesigner
- 核心用途: 训练模型学习专业设计流程,赋予系统强大的工具使用能力
数据集详情
- 数据格式: PSD(Adobe Photoshop Document)设计文件
- 数据规模: 大规模
- 数据质量: 高质量
- 关键标注: 包含操作轨迹(operation traces)的标注
- 覆盖范围: 涵盖广泛的设计场景和艺术风格
数据集构成
- 子集数量: 2个
- 子集用途: 分别用于训练模型的资产整合(asset integration)和图层精修(layer refinement)能力
数据集构建流程
- 收集: 收集高质量的PSD文件
- 分组: 根据底层视觉概念对图层进行分组
- 解析: 解析PSD文件并提取关键信息(如原始资产、元数据、中间渲染结果)
- 构建: 利用提取的数据构建用于资产整合和图层精修的训练数据
关联研究
- 发表会议: CVPR 2026
- 作者单位: 复旦大学、南洋理工大学
- 论文链接: https://henghuiding.com/PSDesigner/
- 代码链接: https://henghuiding.com/PSDesigner/
搜集汇总
数据集介绍

构建方式
在自动化平面设计领域,构建高质量数据集是模拟人类创意流程的关键。CreativePSD的构建采用三阶段流水线,首先从互联网及付费渠道广泛收集涵盖多样设计场景与艺术风格的专业PSD文件,并由专业标注人员依据视觉概念对图层进行分组。随后解析PSD文件,提取原始素材、图层层次元数据及逐步渲染的中间结果。最终基于提取信息,通过预定义规则生成工具调用序列,分别构建用于资产整合的Xgen模式与图层精修的Xedt模式训练数据,从而系统化地记录专家级设计操作轨迹。
特点
该数据集在平面设计数据资源中展现出显著优势,其平均每个样本包含约48.35个图层,形成了远比现有数据集复杂的层次结构,为模型学习真实设计组合提供了挑战性环境。得益于PSD格式的专业性,CreativePSD覆盖了调整图层等多种图层类型,以及混合模式、图层效果、剪贴蒙版等超过60种属性,极大丰富了设计操作的表达范围。尤为重要的是,数据集依据视觉概念对图层进行直观分组,构建出符合专家设计原则的层次化组织,使模型能够更自然地学习人类创意工作流程。
使用方法
CreativePSD主要用于训练PSDesigner系统中的GraphicPlanner模块,以赋予其强大的工具使用能力。在实际应用中,该数据集支持两种设计模式:在Xgen模式下,模型学习如何基于当前设计观察和谐地整合新资产;在Xedt模式下,则专注于检测并精修同一视觉概念组内的缺陷图层。训练过程采用两阶段策略,先通过监督微调学习基础工具调用,再结合GRPO强化学习优化参数预测精度。经过如此训练,模型能够逐步遍历嵌套层次结构,以自底向上的方式迭代整合资产并执行精修,最终生成可编辑的PSD格式设计文件。
背景与挑战
背景概述
在自动化图形设计领域,传统方法通常依赖于简化的工作流程,难以生成可编辑且符合专业标准的设计文件。为了弥合这一差距,复旦大学大数据学院与南洋理工大学生成式人工智能实验室的研究团队于2026年共同创建了CreativePSD数据集。该数据集的核心研究目标是模拟人类设计师的创造性工作流程,通过提供大量带有详细操作轨迹的高质量PSD(Adobe Photoshop文档)文件,训练模型学习专业的设计程序。CreativePSD的构建标志着图形设计自动化研究的一个重要转折点,它首次基于PSD格式构建了大规模设计数据集,极大地推动了可编辑设计文件的自动生成技术,为非专业人士创建生产级设计作品提供了可能。
当前挑战
CreativePSD数据集旨在解决自动化图形设计中两个核心挑战:一是如何将用户意图准确、直观地转化为具有复杂层级结构和丰富属性的可编辑设计文件;二是在构建过程中如何系统性地捕获和标注专业设计师的完整操作轨迹。具体而言,在领域问题层面,该数据集需要克服现有方法在层类型、属性多样性以及层级复杂性方面的局限,以支持模型学习从资产收集、整合到细节优化的完整设计流程。在构建过程中,挑战主要集中于从海量PSD文件中解析出精确的元数据、按视觉概念对图层进行专业分组,以及通过预定义规则将图层配置逆向工程为可训练的工具调用序列,确保操作轨迹的准确性与逻辑连贯性。
常用场景
经典使用场景
在自动化图形设计领域,CreativePSD数据集被广泛用于训练和评估能够模拟人类设计师创意工作流的智能系统。该数据集通过提供大量高质量PSD文件及其详细的操作轨迹,使得模型能够学习从资产收集到逐步整合与精修的专业设计流程。经典应用场景包括开发如PSDesigner这样的自动化设计系统,该系统能够根据用户指令生成可编辑的PSD格式设计文件,实现从意图到成品的端到端转换。
解决学术问题
CreativePSD数据集有效解决了图形设计自动化研究中的若干关键学术问题。传统方法往往简化设计流程,导致生成结果缺乏灵活性和直观性,且难以处理复杂图层层次与多样属性。该数据集通过提供基于视觉概念分组的图层结构、丰富的图层类型(如智能对象、调整图层)及超过60种属性标注,使模型能够学习人类设计师的渐进式创作逻辑。其意义在于首次以PSD格式构建了包含操作轨迹的大规模设计数据集,为模型赋予了强大的工具使用能力,推动了自动化设计系统向更专业、更人性化的方向发展。
衍生相关工作
基于CreativePSD数据集,研究者们衍生出了一系列重要的相关工作。PSDesigner系统作为核心代表,整合了资产收集器、图形规划器和工具执行器等模块,实现了人类工作流的高度仿真。该数据集也促进了针对复杂图层层次与多模态资产整合的模型训练方法,如结合监督微调与强化学习(GRPO)的策略,以提升工具调用的精确性。此外,相关工作还涉及与现有布局生成方法(如LaDeCo)的对比研究,以及在Crello-v5等基准上的性能评估,共同推动了自动化图形设计领域向更复杂、更实用方向的演进。
以上内容由遇见数据集搜集并总结生成



