five

creative-graphic-design/Magazine

收藏
Hugging Face2024-09-05 更新2024-06-15 收录
下载链接:
https://hf-mirror.com/datasets/creative-graphic-design/Magazine
下载链接
链接失效反馈
官方服务:
资源简介:
--- annotations_creators: - machine-generated language_creators: - found language: - en license: - unknown multilinguality: - monolingual size_categories: [] source_datasets: - original task_categories: - image-to-image - text-to-image - unconditional-image-generation task_ids: [] pretty_name: Magazine tags: - graphic design - layout - content-aware configs: - config_name: default data_files: - split: train path: data/train-* dataset_info: features: - name: filename dtype: string - name: category dtype: class_label: names: '0': fashion '1': food '2': news '3': science '4': travel '5': wedding - name: size struct: - name: width dtype: int64 - name: height dtype: int64 - name: elements sequence: - name: label dtype: class_label: names: '0': text '1': image '2': headline '3': text-over-image '4': headline-over-image - name: polygon_x sequence: float32 - name: polygon_y sequence: float32 - name: keywords sequence: string - name: images sequence: image splits: - name: train num_bytes: 4655342211.434 num_examples: 3919 download_size: 4652903538 dataset_size: 4655342211.434 --- # Dataset Card for Magazine dataset [![CI](https://github.com/shunk031/huggingface-datasets_Magazine/actions/workflows/ci.yaml/badge.svg)](https://github.com/shunk031/huggingface-datasets_Magazine/actions/workflows/ci.yaml) ## Table of Contents - [Dataset Card Creation Guide](#dataset-card-creation-guide) - [Table of Contents](#table-of-contents) - [Dataset Description](#dataset-description) - [Dataset Summary](#dataset-summary) - [Supported Tasks and Leaderboards](#supported-tasks-and-leaderboards) - [Languages](#languages) - [Dataset Structure](#dataset-structure) - [Data Instances](#data-instances) - [Data Fields](#data-fields) - [Data Splits](#data-splits) - [Dataset Creation](#dataset-creation) - [Curation Rationale](#curation-rationale) - [Source Data](#source-data) - [Initial Data Collection and Normalization](#initial-data-collection-and-normalization) - [Who are the source language producers?](#who-are-the-source-language-producers) - [Annotations](#annotations) - [Annotation process](#annotation-process) - [Who are the annotators?](#who-are-the-annotators) - [Personal and Sensitive Information](#personal-and-sensitive-information) - [Considerations for Using the Data](#considerations-for-using-the-data) - [Social Impact of Dataset](#social-impact-of-dataset) - [Discussion of Biases](#discussion-of-biases) - [Other Known Limitations](#other-known-limitations) - [Additional Information](#additional-information) - [Dataset Curators](#dataset-curators) - [Licensing Information](#licensing-information) - [Citation Information](#citation-information) - [Contributions](#contributions) ## Dataset Description - **Homepage:** https://xtqiao.com/projects/content_aware_layout/ - **Repository:** https://github.com/shunk031/huggingface-datasets_Magazine - **Paper (SIGGRAPH2019):** https://dl.acm.org/doi/10.1145/3306346.3322971 ### Dataset Summary A large-scale magazine layout dataset with fine-grained layout annotations and keyword labeling. ### Supported Tasks and Leaderboards [More Information Needed] ### Languages [More Information Needed] ## Dataset Structure ### Data Instances <!-- To use Magazine dataset, you need to download the image and layout annotations from the [OneDrive](https://portland-my.sharepoint.com/:f:/g/personal/xqiao6-c_my_cityu_edu_hk/EhmRh5SFoQ9Hjl_aRjCOltkBKFYefiSagR6QLJ7pWvs3Ww?e=y8HO5Q) in the [official page](https://xtqiao.com/projects/content_aware_layout/). Then place the downloaded files in the following structure and specify its path. ```shell /path/to/datasets ├── MagImage.zip └── MagLayout.zip ``` ```python import datasets as ds dataset = ds.load_dataset( path="shunk031/Magazine", data_dir="/path/to/datasets/", # Specify the path of the downloaded directory. ) ``` --> ```python import datasets as ds dataset = ds.load_dataset("creative-graphic-design/Magazine") ``` ### Data Fields [More Information Needed] ### Data Splits [More Information Needed] ## Dataset Creation ### Curation Rationale [More Information Needed] ### Source Data [More Information Needed] #### Initial Data Collection and Normalization [More Information Needed] #### Who are the source language producers? [More Information Needed] ### Annotations [More Information Needed] #### Annotation process [More Information Needed] #### Who are the annotators? [More Information Needed] ### Personal and Sensitive Information [More Information Needed] ## Considerations for Using the Data ### Social Impact of Dataset [More Information Needed] ### Discussion of Biases [More Information Needed] ### Other Known Limitations [More Information Needed] ## Additional Information ### Dataset Curators [More Information Needed] ### Licensing Information ``` Copyright (c) 2019, Xiaotian Qiao All rights reserved. This code is copyrighted by the authors and is for non-commercial research purposes only. Redistribution and use in source and binary forms, with or without modification, are permitted provided that the following conditions are met: * Redistributions of source code must retain the above copyright notice, this list of conditions and the following disclaimer. * Redistributions in binary form must reproduce the above copyright notice, this list of conditions and the following disclaimer in the documentation and/or other materials provided with the distribution. THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT HOLDER OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE. ``` ### Citation Information ```bibtex @article{zheng2019content, title={Content-aware generative modeling of graphic design layouts}, author={Zheng, Xinru and Qiao, Xiaotian and Cao, Ying and Lau, Rynson WH}, journal={ACM Transactions on Graphics (TOG)}, volume={38}, number={4}, pages={1--15}, year={2019}, publisher={ACM New York, NY, USA} } ``` ### Contributions Thanks to [Xinru Zheng and Xiaotian Qiao](https://xtqiao.com/projects/content_aware_layout/) for creating this dataset.

annotations_creators: - 机器生成 language_creators: - 采集所得 language: - 英语 license: - 未知 multilinguality: - 单语言 size_categories: [] source_datasets: - 原始数据集 task_categories: - 图像到图像(image-to-image) - 文本到图像(text-to-image) - 无条件图像生成(unconditional-image-generation) task_ids: [] pretty_name: 杂志(Magazine) tags: - 平面设计(graphic design) - 版面布局(layout) - 内容感知(content-aware) configs: - config_name: default data_files: - split: train path: data/train-* dataset_info: features: - name: filename dtype: 字符串(string) - name: category dtype: 类标签(class_label): 命名项: '0': 时尚(fashion) '1': 食品(food) '2': 新闻(news) '3': 科学(science) '4': 旅游(travel) '5': 婚礼(wedding) - name: size 结构体(struct): - name: width dtype: 64位整数(int64) - name: height dtype: 64位整数(int64) - name: elements 序列(sequence): - name: label dtype: 类标签(class_label): 命名项: '0': 文本(text) '1': 图像(image) '2': 标题(headline) '3': 图像上文本(text-over-image) '4': 图像上标题(headline-over-image) - name: polygon_x 序列(sequence): 32位浮点数(float32) - name: polygon_y 序列(sequence): 32位浮点数(float32) - name: keywords 序列(sequence): 字符串(string) - name: images 序列(sequence): 图像(image) splits: - name: train num_bytes: 4655342211.434 num_examples: 3919 download_size: 4652903538 dataset_size: 4655342211.434 # Magazine数据集卡片 [![CI](https://github.com/shunk031/huggingface-datasets_Magazine/actions/workflows/ci.yaml/badge.svg)](https://github.com/shunk031/huggingface-datasets_Magazine/actions/workflows/ci.yaml) ## 目录 - [数据集卡片制作指南](#数据集卡片制作指南) - [目录](#目录) - [数据集概述](#数据集概述) - [数据集总结](#数据集总结) - [支持任务与基准测试榜单](#支持任务与基准测试榜单) - [使用语言](#使用语言) - [数据集结构](#数据集结构) - [数据实例](#数据实例) - [数据字段](#数据字段) - [数据划分](#数据划分) - [数据集创建](#数据集创建) - [数据集构建初衷](#数据集构建初衷) - [源数据](#源数据) - [初始数据收集与标准化](#初始数据收集与标准化) - [源语言生产者是谁?](#源语言生产者是谁?) - [标注信息](#标注信息) - [标注流程](#标注流程) - [标注者是谁?](#标注者是谁?) - [个人与敏感信息](#个人与敏感信息) - [数据集使用注意事项](#数据集使用注意事项) - [数据集的社会影响](#数据集的社会影响) - [偏差讨论](#偏差讨论) - [其他已知局限性](#其他已知局限性) - [附加信息](#附加信息) - [数据集维护者](#数据集维护者) - [许可信息](#许可信息) - [引用信息](#引用信息) - [贡献](#贡献) ## 数据集概述 - **主页:** https://xtqiao.com/projects/content_aware_layout/ - **代码仓库:** https://github.com/shunk031/huggingface-datasets_Magazine - **论文(SIGGRAPH2019):** https://dl.acm.org/doi/10.1145/3306346.3322971 ### 数据集总结 该数据集为大规模杂志版面布局数据集,包含细粒度版面布局标注与关键词标注。 ### 支持任务与基准测试榜单 [需补充更多信息] ### 使用语言 [需补充更多信息] ## 数据集结构 ### 数据实例 若要使用Magazine数据集,需从官方页面[https://xtqiao.com/projects/content_aware_layout/]的OneDrive链接下载图像与布局标注文件,随后将下载的文件按如下结构放置,并指定其路径。 shell /path/to/datasets ├── MagImage.zip └── MagLayout.zip python import datasets as ds dataset = ds.load_dataset( path="shunk031/Magazine", data_dir="/path/to/datasets/", # 指定下载数据集所在目录的路径。 ) 也可使用如下代码加载: python import datasets as ds dataset = ds.load_dataset("creative-graphic-design/Magazine") ### 数据字段 [需补充更多信息] ### 数据划分 [需补充更多信息] ## 数据集创建 ### 数据集构建初衷 [需补充更多信息] ### 源数据 [需补充更多信息] #### 初始数据收集与标准化 [需补充更多信息] #### 源语言生产者是谁? [需补充更多信息] ### 标注信息 [需补充更多信息] #### 标注流程 [需补充更多信息] #### 标注者是谁? [需补充更多信息] ### 个人与敏感信息 [需补充更多信息] ## 数据集使用注意事项 ### 数据集的社会影响 [需补充更多信息] ### 偏差讨论 [需补充更多信息] ### 其他已知局限性 [需补充更多信息] ## 附加信息 ### 数据集维护者 [需补充更多信息] ### 许可信息 Copyright (c) 2019, Xiaotian Qiao 保留所有权利。 本代码受作者版权保护,仅可用于非商业性研究用途。 无论是否对源代码进行修改,以源代码或二进制形式再分发和使用本软件,均需满足以下条件: * 源代码的再分发必须保留上述版权声明、本条件列表以及如下免责声明。 * 二进制形式的再分发必须在随附的文档和/或其他材料中复制上述版权声明、本条件列表以及如下免责声明。 本软件由版权持有者和贡献者“按原样”提供,不附带任何明示或默示的担保,包括但不限于适销性和特定用途适用性的默示担保。在任何情况下,版权持有者或贡献者均不对任何直接、间接、附带、特殊、惩戒性或间接损害(包括但不限于替代商品或服务的采购、使用、数据或利润损失,或业务中断)承担责任,无论该责任源于合同、严格责任或侵权(包括疏忽或其他),无论是否事先知晓该损害的可能性。 ### 引用信息 bibtex @article{zheng2019content, title={Content-aware generative modeling of graphic design layouts}, author={Zheng, Xinru and Qiao, Xiaotian and Cao, Ying and Lau, Rynson WH}, journal={ACM Transactions on Graphics (TOG)}, volume={38}, number={4}, pages={1--15}, year={2019}, publisher={ACM New York, NY, USA} } ### 贡献 感谢[Xinru Zheng与Xiaotian Qiao](https://xtqiao.com/projects/content_aware_layout/)创建本数据集。
提供机构:
creative-graphic-design
原始信息汇总

数据集卡片 - Magazine数据集

数据集描述

数据集概述

一个大规模的杂志布局数据集,具有细粒度的布局注释和关键词标记。

支持的任务和排行榜

[更多信息需要]

语言

[更多信息需要]

数据集结构

数据实例

要使用Magazine数据集,您需要从OneDrive下载图像和布局注释,并将其放置在以下结构中并指定其路径:

shell /path/to/datasets ├── MagImage.zip └── MagLayout.zip

python import datasets as ds

dataset = ds.load_dataset( path="shunk031/Magazine", data_dir="/path/to/datasets/", # 指定下载目录的路径 )

数据字段

[更多信息需要]

数据分割

[更多信息需要]

数据集创建

策划理由

[更多信息需要]

源数据

[更多信息需要]

初始数据收集和规范化

[更多信息需要]

源语言生产者是谁?

[更多信息需要]

注释

[更多信息需要]

注释过程

[更多信息需要]

注释者是谁?

[更多信息需要]

个人和敏感信息

[更多信息需要]

使用数据集的注意事项

数据集的社会影响

[更多信息需要]

偏见的讨论

[更多信息需要]

其他已知限制

[更多信息需要]

附加信息

数据集策展人

[更多信息需要]

许可信息

[更多信息需要]

引用信息

bibtex @article{zheng2019content, title={Content-aware generative modeling of graphic design layouts}, author={Zheng, Xinru and Qiao, Xiaotian and Cao, Ying and Lau, Rynson WH}, journal={ACM Transactions on Graphics (TOG)}, volume={38}, number={4}, pages={1--15}, year={2019}, publisher={ACM New York, NY, USA} }

贡献

感谢Xinru Zheng和Xiaotian Qiao创建此数据集。

搜集汇总
数据集介绍
main_image_url
构建方式
该数据集的构建基于对大规模杂志布局的精细标注和关键词标记,旨在为图像到图像、文本到图像以及无条件图像生成等任务提供丰富的训练资源。数据集包含了杂志的图像和对应的布局标注,通过对原始数据进行收集和规范化处理,构建了一个包含3919个训练样本的集合。
特点
Magazine数据集的特点在于其提供了大规模的杂志布局实例,并且每个实例都附带了详细的布局标注和关键词信息。这些布局标注包括文本、图像、标题等元素的类别和位置,为研究人员和开发者提供了丰富的细粒度信息,有助于提升图形设计、布局生成等领域的算法性能。
使用方法
使用该数据集时,用户需要通过Hugging Face的datasets库加载数据集,并指定数据目录。数据集加载后,用户可以访问图像、布局标注、关键词等字段,进行进一步的数据处理和模型训练。此外,数据集的官方页面还提供了图像和布局标注文件的下载链接,以便用户进行离线使用和探索。
背景与挑战
背景概述
Magazine数据集,诞生于2019年,由Xiaotian Qiao等研究人员精心构建,旨在为图像布局生成领域提供一种内容感知的生成模型。该数据集包含大量杂志布局,具有精细的布局注释和关键词标注。其核心研究问题是如何通过内容感知生成技术,自动化地创建视觉吸引力的图像布局。在图像生成与图形设计领域,Magazine数据集的影响力不容小觑,为相关研究提供了宝贵的资源。
当前挑战
该数据集在构建过程中遇到的挑战包括:1)如何准确地进行图像布局的注释,确保生成模型的准确性;2)如何平衡数据集中不同类别的样本,以避免模型对某一类别的过度拟合;3)在生成模型的设计中,如何处理多样化的设计元素,如文本、图像、标题等,以及它们在布局中的位置关系。在解决领域问题上,Magazine数据集面临的挑战是如何生成既符合设计原则又具有创意性的图像布局,同时确保其内容的相关性和视觉吸引力。
常用场景
经典使用场景
在图形设计领域,Magazine数据集以其精细的布局注释和关键词标注而成为研究的热点。其经典使用场景主要在于训练内容感知的生成模型,以自动创建视觉吸引力的杂志布局。通过对该数据集的学习,模型能够理解和模仿专业设计师的布局决策,为不同类别的内容生成适配的视觉布局。
衍生相关工作
基于Magazine数据集,衍生出了多项经典工作,如内容感知的布局生成模型、图像与文本的协同生成算法等。这些研究进一步推动了计算机图形学和计算机视觉领域的结合,为智能设计系统的发展奠定了基础。
数据集最近研究
最新研究方向
在图像生成与布局设计领域,Magazine数据集以其细腻的布局标注和关键词标记受到研究者的广泛关注。近期,该数据集被用于内容感知生成模型的研究,旨在通过深度学习技术自动生成具有视觉吸引力的图形设计布局。此研究方向对于在线出版、广告设计以及个性化内容展示等领域具有重要影响,有助于提升自动化设计系统的生成质量和效率。研究者们通过该数据集正在探索如何更好地融合文本、图像以及布局元素,以创造出既符合设计原则又满足用户需求的作品,推动着图形设计自动化技术的发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作