LICA Dataset
收藏LICA 数据集概述
数据集基本信息
- 名称:LICA Dataset
- 规模:包含 1,183 个平面设计布局
- 核心内容:每个布局包含组件级规格说明和自然语言标注
- 关联论文:LICA: Layered Image Composition Annotations for Graphic Design Research
- 其他获取地址:HuggingFace
- 许可协议:Creative Commons Attribution 4.0 International (CC BY 4.0)
数据集结构
数据集根目录为 lica-data,其结构如下:
lica-data/ ├── metadata.csv # 每个布局的元数据 ├── layouts/ │ └── <template_id>/ │ └── <layout_id>.json # 组件级布局规格文件 ├── images/ │ └── <template_id>/ │ └── <layout_id>.png 或 .mp4 # 渲染后的布局(图像或视频) └── annotations/ ├── template_annotations.json # 模板级标注 └── <template_id>/ └── <layout_id>.json # 每个布局的标注
元数据文件 (metadata.csv)
| 列名 | 类型 | 描述 |
|---|---|---|
layout_id |
string | 唯一布局ID(与 layouts/、images/、annotations/ 中的文件名匹配) |
category |
string | 设计类别(例如 "Presentations"、"Videos"、"Education"、"Flyers") |
template_id |
string | 父模板的UUID(与文件夹名匹配) |
n_template_layouts |
int | 模板组中的布局数量 |
template_layout_index |
int | 在模板组中的零基索引位置 |
width |
int | 画布宽度(像素) |
height |
int | 画布高度(像素) |
布局JSON文件 (layouts/<template_id>/<layout_id>.json)
每个文件包含画布规格和一个有序的组件列表。 json { "components": [ ... ], "background": "rgb(252, 252, 252)", "width": "1920px", "height": "1080px", "duration": 3 }
| 字段 | 类型 | 必需 | 描述 |
|---|---|---|---|
components |
array | 是 | 渲染组件的有序列表 |
width |
string | 是 | 画布宽度,带 "px" 后缀 |
height |
string | 是 | 画布高度,带 "px" 后缀 |
background |
string | 否 | 画布背景的CSS颜色 |
duration |
number | 否 | 幻灯片持续时间(秒) |
组件类型
每个组件都有一个 type 字段和类似CSS的定位/视觉属性。
TEXT:定位文本元素IMAGE:定位图像GROUP:具有可选裁剪路径的容器/形状元素
标注文件
- 每个布局的标注 (
annotations/<template_id>/<layout_id>.json):包含description(布局视觉描述)、aesthetics(设计风格、构图、视觉层次说明)、tags(逗号分隔的关键词标签)、user_intent(设计目的的推断)和raw(上述所有字段的拼接)。 - 模板级标注 (
annotations/template_annotations.json):一个以模板UUID为键的JSON对象。每个条目具有相同的字段,但描述的是模板中所有布局共享的设计主题。
数据组织与分组
- 布局按模板(一个能产生多个幻灯片变体的设计主题)进行分组。
- 每个模板包含多个布局变体。
使用方式与API
提供了 lica_dataset Python 模块用于加载和操作数据集。
- 主要类:
LicaDataset(data_root) - 核心功能:
- 按类别、模板、尺寸、宽高比进行过滤。
- 通过布局ID获取布局规格、标注、渲染文件路径和元数据。
- 支持迭代访问。
- 提供汇总信息(如唯一类别、模板ID等)。
- 模块级函数:包括
load_dataset、load_layouts_by_template、load_layouts_by_category、iter_template_groups。
引用
bibtex @article{Hirsch2026LICA, title = {LICA: Layered Image Composition Annotations for Graphic Design Research}, author = {Hirsch, Elad and Yadav, Shubham and Garg, Mohit and Mehta, Purvanshi}, journal = {arXiv preprint arXiv:2603.16098}, year = {2026} }




