creative-graphic-design/PKU-PosterLayout
收藏Hugging Face2025-04-18 更新2024-06-15 收录
下载链接:
https://hf-mirror.com/datasets/creative-graphic-design/PKU-PosterLayout
下载链接
链接失效反馈官方服务:
资源简介:
PKU-PosterLayout是一个用于内容感知的视觉-文本展示布局的新数据集和基准。该数据集包含原始海报、修复后的海报、显著性图等图像数据,以及相关的注释信息。数据集语言为中文,分为训练集和测试集,训练集包含9974个样本,测试集包含905个样本。
PKU-PosterLayout is a new dataset and benchmark for content-aware visual-textual presentation layout. The dataset includes Chinese poster images and their associated saliency maps. The features of the dataset include original poster images, inpainted poster images, saliency maps generated by two different methods, and canvas images. Additionally, the dataset contains annotation information such as poster paths, total elements, classified elements, and bounding box elements. The dataset is divided into training and test sets, containing 9974 and 905 samples respectively. The dataset is licensed under cc-by-sa-4.0.
提供机构:
creative-graphic-design
原始信息汇总
数据集概述
基本信息
- 数据集名称: PKU-PosterLayout
- 语言: 中文
- 许可证: CC BY-SA 4.0
- 标签: layout-generation, graphic design
数据结构
特征
- original_poster: 原始海报图像
- inpainted_poster: 修复后的海报图像
- basnet_saliency_map: BASNet 显著性图
- pfpn_saliency_map: PFPN 显著性图
- canvas: 画布图像
- annotations: 标注信息
- poster_path: 海报路径
- total_elem: 总元素数量
- cls_elem: 分类元素数量
- box_elem: 边界框元素
数据分割
- 训练集:
- 文件路径: data/train-*
- 字节数: 7145995465.374
- 样本数: 9974
- 测试集:
- 文件路径: data/test-*
- 字节数: 366746518.0
- 样本数: 905
数据集大小
- 下载大小: 7351207315
- 数据集大小: 7512741983.374
搜集汇总
数据集介绍

构建方式
在视觉传达设计领域,PKU-PosterLayout数据集的构建体现了对内容感知布局生成任务的深度探索。该数据集基于扩展的PosterErase源数据,通过专家生成的方式精心标注。其构建过程系统性地采集了原始海报图像,并运用修复技术生成对应的修复版本,同时整合了基于BASNet与PFPN模型的显著性图,以量化视觉注意力分布。每个样本均包含详细的布局标注,涵盖文本、标识、衬底等元素的类别与边界框信息,形成了结构化的多模态数据集合。
特点
该数据集在图形设计与布局生成研究中展现出鲜明的特色。其核心在于提供了双重配置:默认配置专注于基础布局分析,而RALF风格配置则引入了更精细的预处理,包含子显著性图等增强特征。数据集全部样本均使用中文内容,专为中文环境下的视觉文本呈现而设计。数据规模庞大,训练集与测试集划分明确,且标注质量由专家保障,确保了其在学术基准中的可靠性与权威性。
使用方法
对于研究人员而言,该数据集为训练与评估内容感知的自动布局模型提供了标准平台。用户可通过Hugging Face的datasets库直接加载,使用`load_dataset`函数并指定数据集名称即可访问默认或RALF风格配置。数据字段结构清晰,包含图像、显著性图及序列化标注,便于输入深度学习管道进行端到端训练。该数据集主要支持布局生成等计算机视觉任务,其官方论文与基准为方法性能比较提供了严谨的参照依据。
背景与挑战
背景概述
在视觉传达设计领域,海报布局的自动化生成一直是计算机视觉与图形学交叉研究的前沿课题。PKU-PosterLayout数据集由北京大学智能计算与系统实验室于2023年创建,并发表于CVPR会议,旨在为内容感知的视觉文本呈现布局提供基准。该数据集聚焦于解决海报设计中元素(如文本、标志、底图)的智能排布问题,通过提供大量标注丰富的真实海报样本,推动了生成式设计模型的发展,对自动化平面设计工具的研发具有显著影响力。
当前挑战
该数据集致力于应对海报布局生成中的核心挑战:如何实现内容感知的视觉元素自适应排布,以平衡美学与功能性需求。构建过程中的挑战包括从原始海报中精确提取并标注多类元素(文本、标志、底图等),确保标注的一致性与准确性;同时,数据来源于扩展的PosterErase数据集,需处理图像修复后的对齐与质量把控,以及应对中文环境下的布局多样性,这增加了数据清洗与标准化的复杂度。
常用场景
经典使用场景
在视觉文本布局生成领域,PKU-PosterLayout数据集为研究者提供了丰富的海报设计样本,其经典使用场景在于训练和评估内容感知的自动布局生成模型。该数据集通过标注文本、标志和底图等元素的位置与类别,使得机器学习模型能够学习如何根据视觉内容智能地安排版面元素,从而生成既美观又符合设计原则的海报布局。这一过程不仅涉及计算机视觉技术,还融合了图形设计的美学考量,为自动化设计工具的开发奠定了数据基础。
解决学术问题
该数据集主要解决了视觉文本呈现中的内容感知布局生成问题,即在给定视觉和文本内容的前提下,如何自动生成合理且美观的版面安排。这一挑战涉及多模态信息的融合与空间关系的建模,传统方法往往依赖手工规则或简单启发式策略,难以适应复杂多变的实际需求。PKU-PosterLayout通过提供大规模标注数据,支持数据驱动的方法研究,推动了布局生成从规则驱动向学习驱动的范式转变,对计算机视觉与图形学的交叉研究具有重要理论意义。
衍生相关工作
基于PKU-PosterLayout数据集,已衍生出多项经典研究工作,例如CVPR 2023中提出的PosterLayout方法,该工作引入了一种内容感知的布局生成框架,结合了显著性检测与序列生成技术。后续研究如RALF(Reinforcement Learning for Adaptive Layout)进一步探索了强化学习在布局优化中的应用,通过风格迁移与自适应调整提升了生成布局的多样性与质量。这些工作不仅扩展了数据集的学术影响力,也为视觉文本生成领域提供了新的技术思路与评估基准。
以上内容由遇见数据集搜集并总结生成



