LICA Dataset

github2026-04-14 更新2026-04-19 收录

下载链接：

https://github.com/lica-world/lica-dataset

下载链接

链接失效反馈

官方服务：

资源简介：

一个包含1,183个图形设计布局的集合，具有组件级规格和自然语言注释。每个布局捕获了设计的完整渲染规范，包括位置、排版、图像、背景等，并在布局和模板级别提供了注释。布局按模板分组（一个设计主题产生多个幻灯片变体）。

A collection of 1,183 graphic design layouts, equipped with component-level specifications and natural language annotations. Each layout captures the complete rendering specification of a design, covering aspects such as positioning, typography, images, and backgrounds, with annotations provided at both the layout and template levels. The layouts are grouped by templates, where one design theme yields multiple slide variants.

创建时间：

2026-04-14

原始信息汇总

LICA 数据集概述

数据集基本信息

名称：LICA Dataset
规模：包含 1,183 个平面设计布局
核心内容：每个布局包含组件级规格说明和自然语言标注
关联论文：LICA: Layered Image Composition Annotations for Graphic Design Research
其他获取地址：HuggingFace
许可协议：Creative Commons Attribution 4.0 International (CC BY 4.0)

数据集结构

数据集根目录为 lica-data，其结构如下：

lica-data/ ├── metadata.csv # 每个布局的元数据 ├── layouts/ │ └── <template_id>/ │ └── <layout_id>.json # 组件级布局规格文件 ├── images/ │ └── <template_id>/ │ └── <layout_id>.png 或 .mp4 # 渲染后的布局（图像或视频） └── annotations/ ├── template_annotations.json # 模板级标注 └── <template_id>/ └── <layout_id>.json # 每个布局的标注

元数据文件 (`metadata.csv`)

列名	类型	描述
`layout_id`	string	唯一布局ID（与 `layouts/`、`images/`、`annotations/` 中的文件名匹配）
`category`	string	设计类别（例如 `"Presentations"`、`"Videos"`、`"Education"`、`"Flyers"`）
`template_id`	string	父模板的UUID（与文件夹名匹配）
`n_template_layouts`	int	模板组中的布局数量
`template_layout_index`	int	在模板组中的零基索引位置
`width`	int	画布宽度（像素）
`height`	int	画布高度（像素）

布局JSON文件 (`layouts/<template_id>/<layout_id>.json`)

每个文件包含画布规格和一个有序的组件列表。 json { "components": [ ... ], "background": "rgb(252, 252, 252)", "width": "1920px", "height": "1080px", "duration": 3 }

字段	类型	必需	描述
`components`	array	是	渲染组件的有序列表
`width`	string	是	画布宽度，带 `"px"` 后缀
`height`	string	是	画布高度，带 `"px"` 后缀
`background`	string	否	画布背景的CSS颜色
`duration`	number	否	幻灯片持续时间（秒）

组件类型

每个组件都有一个 type 字段和类似CSS的定位/视觉属性。

TEXT：定位文本元素
IMAGE：定位图像
GROUP：具有可选裁剪路径的容器/形状元素

标注文件

每个布局的标注 (annotations/<template_id>/<layout_id>.json)：包含 description（布局视觉描述）、aesthetics（设计风格、构图、视觉层次说明）、tags（逗号分隔的关键词标签）、user_intent（设计目的的推断）和 raw（上述所有字段的拼接）。
模板级标注 (annotations/template_annotations.json)：一个以模板UUID为键的JSON对象。每个条目具有相同的字段，但描述的是模板中所有布局共享的设计主题。

数据组织与分组

布局按模板（一个能产生多个幻灯片变体的设计主题）进行分组。
每个模板包含多个布局变体。

使用方式与API

提供了 lica_dataset Python 模块用于加载和操作数据集。

主要类：LicaDataset(data_root)
核心功能：
- 按类别、模板、尺寸、宽高比进行过滤。
- 通过布局ID获取布局规格、标注、渲染文件路径和元数据。
- 支持迭代访问。
- 提供汇总信息（如唯一类别、模板ID等）。
模块级函数：包括 load_dataset、load_layouts_by_template、load_layouts_by_category、iter_template_groups。

引用

bibtex @article{Hirsch2026LICA, title = {LICA: Layered Image Composition Annotations for Graphic Design Research}, author = {Hirsch, Elad and Yadav, Shubham and Garg, Mohit and Mehta, Purvanshi}, journal = {arXiv preprint arXiv:2603.16098}, year = {2026} }

搜集汇总

数据集介绍

构建方式

在图形设计研究领域，LICA数据集的构建体现了对设计布局的精细化解析。该数据集通过收集1183个图形设计布局，每个布局均包含组件级别的详细规格与自然语言标注。布局按照设计主题进行分组，形成模板结构，确保了设计变体之间的内在关联性。数据采集过程涵盖了位置、排版、图像及背景等完整渲染规范，同时为每个布局及模板提供了多层次的注释信息，从而构建了一个结构严谨且内容丰富的设计资源库。

特点

LICA数据集的特点在于其多层次的结构化表示与详尽的标注体系。数据集不仅提供了每个布局的视觉渲染图像或视频，还包含了精确的JSON格式布局规范，详细描述了文本、图像及分组组件的属性与样式。注释部分涵盖布局描述、美学评价、标签及用户意图，同时模板级注释进一步揭示了设计主题的统一特征。这种组件级与语义级信息的结合，为图形设计生成、分析与理解任务提供了全面而细致的数据支持。

使用方法

使用LICA数据集时，研究者可通过提供的Python库便捷地加载与操作数据。数据集支持按设计类别、模板ID、画布尺寸或宽高比进行过滤，并可链式调用以构建定制视图。用户能够访问特定布局的JSON规范、注释信息及渲染文件路径，或通过迭代方式遍历所有记录。此外，模块级函数如按模板或类别加载布局、迭代模板分组等，进一步简化了数据探索流程，使得该数据集易于集成到各类图形设计与机器学习研究项目中。

背景与挑战

背景概述

在视觉设计与计算创意交叉领域，高质量、结构化数据的匮乏长期制约着自动化设计生成与智能布局理解的研究进展。LICA数据集应运而生，作为一项于2026年由Elad Hirsch、Shubham Yadav、Mohit Garg和Purvanshi Mehta等研究人员在arXiv预印本中首次公开的学术资源，其核心研究问题聚焦于如何为图形设计布局提供细粒度的组件级规范与自然语言标注。该数据集收录了1,183个涵盖演示文稿、视频、教育材料及传单等多类别的设计布局，每个布局均包含精确的渲染规格与多层次注释，旨在推动设计意图理解、布局生成与个性化内容创作等方向的发展，为相关领域提供了宝贵的基准测试与模型训练基础。

当前挑战

LICA数据集致力于应对图形设计自动化中的核心挑战，即如何使机器深度理解并生成符合美学与功能要求的复杂视觉布局。具体而言，其解决的领域问题涉及设计布局的语义解析与可控生成，这要求模型不仅能识别文本、图像等元素，还需把握其空间关系、视觉层次与整体风格。在构建过程中，挑战同样显著：一方面，收集并标准化大量真实世界设计布局，确保组件级属性（如位置、字体、颜色）的精确标注，需要克服数据异构性与标注一致性问题；另一方面，创建兼具布局级与模板级的自然语言注释，以捕捉设计主题与用户意图，对标注的深度与广度提出了较高要求。

常用场景

经典使用场景

在图形设计自动化研究领域，LICA数据集以其丰富的组件级布局规格和自然语言标注，为设计生成与理解模型提供了标准化的训练与评估基准。该数据集收录了涵盖演示文稿、视频、教育材料等多种设计类别的布局，每个布局均包含精确的视觉元素位置、样式属性及语义描述，使得研究人员能够系统地探索布局生成、风格迁移以及设计意图解析等核心任务。通过模板分组的结构，数据集进一步支持对设计主题一致性与变体生成的研究，为算法在保持设计连贯性的同时创造多样性提供了关键数据支撑。

解决学术问题

LICA数据集有效应对了图形设计研究中数据稀缺与标注粒度不足的挑战，为设计自动化的学术探索奠定了数据基础。它通过提供组件级的详细渲染规格与多层次注释，使得机器学习模型能够学习设计元素的空间关系、视觉层次及美学原则，从而推动布局生成、设计推荐和内容适配等问题的解决。该数据集的结构化标注尤其有助于解析设计语义与视觉呈现之间的映射关系，为理解用户意图与设计风格的一致性提供了实证依据，显著提升了设计智能系统的可解释性与泛化能力。

衍生相关工作

围绕LICA数据集，学术界已衍生出一系列经典研究工作，主要集中在布局生成模型、设计语义理解以及多模态设计系统等领域。例如，结合生成对抗网络（GAN）或扩散模型的技术，研究者开发了能够根据自然语言描述自动生成符合美学规范的布局的算法；同时，基于模板级注释的研究探索了设计主题的保持与变体生成，促进了可控性设计生成的发展。这些工作不仅验证了数据集的实用价值，也推动了图形设计自动化与人工智能交叉领域的理论创新与技术演进。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集