Aaron Koblin Sheep Market, Kanji Stroke Data, Omniglot Stroke Data

github2019-07-15 更新2024-05-31 收录

下载链接：

https://github.com/afcarl/sketch-rnn-datasets

下载链接

链接失效反馈

官方服务：

资源简介：

本仓库包含三个数据集：Aaron Koblin Sheep Market, Kanji Stroke Data, Omniglot Stroke Data。这些数据集是为训练`sketch-rnn`模型而定制的，每个样本存储为坐标偏移列表和笔是否离开纸面的二进制值。数据集可用于训练新的生成矢量图像模型。

This repository contains three datasets: Aaron Koblin Sheep Market, Kanji Stroke Data, and Omniglot Stroke Data. These datasets are specifically tailored for training the `sketch-rnn` model, with each sample stored as a list of coordinate offsets and a binary value indicating whether the pen is lifted off the paper. The datasets can be utilized to train new generative vector image models.

创建时间：

2018-05-29

原始信息汇总

Simple Vector Drawing Datasets 概述

数据集内容

本数据集包含三个子数据集，用于训练 sketch-rnn 模型，以生成矢量图形：

Aaron Koblin Sheep Market
- 存储路径：Aaron Koblin Sheep Market
Kanji Stroke Data
- 存储路径：Kanji Stroke Data
Omniglot Stroke Data
- 存储路径：Omniglot Stroke Data

数据格式

每个数据集中的样本以 stroke-3 格式存储，即一系列坐标偏移量（∆x, ∆y）和一个二进制值，表示笔是否离开纸面。此格式在 Alex Graves 的论文中有详细描述。

数据加载示例

数据集以 np.array 格式存储，使用 np.int16 数据类型。以下是加载 Kanji Stroke Data 数据集的示例代码：

python filename = "sketch-rnn-datasets/kanji/short_kanji.npz" load_data = np.load(filename) train_set = load_data[train] valid_set = load_data[valid] test_set = load_data[test]

print len(train_set) # 输出: 10000 print len(valid_set) # 输出: 600 print len(test_set) # 输出: 500

数据预处理

部分数据集进行了简单的笔画简化预处理，使用 Ramer-Douglas-Peucker (RDP) 算法，epsilon 参数值介于 1.0 至 3.0 之间。

许可证信息

每个数据集的许可证和版权信息请查看各自目录下的详细说明。

搜集汇总

数据集介绍

构建方式

该数据集的构建基于stroke-3向量格式，其中每个样本存储为一系列坐标偏移量（∆x, ∆y）以及表示笔是否从纸上抬起的二进制值。数据集包含三种类型：Aaron Koblin Sheep Market、Kanji Stroke Data及Omniglot Stroke Data，分别代表不同的图像绘制序列。数据采用Python列表的形式存储，每个示例为一个np.array，数据类型为np.int16，通过特定的库函数即可轻松加载。

特点

数据集的特点在于采用stroke-3格式简化了图像的存储方式，降低了数据的复杂性，同时便于模型的快速处理。此外，数据集经过Ramer-Douglas-Peucker算法的预处理，对线条进行了简化，从而在保持图像特征的同时减少了噪声。这些特性使得数据集非常适合于训练生成向量图像模型。

使用方法

使用该数据集时，用户需要先加载.npy格式的文件，其中包含了训练集、验证集和测试集。数据可以直接在Jupyter notebook中使用numpy库加载，并通过draw_strokes函数可视化单个示例。用户还可以根据需要，利用开源代码对SVG图像进行预处理，转换为stroke-3格式，以适应不同的模型训练需求。

背景与挑战

背景概述

在计算机视觉与机器学习领域，生成模型的发展推动了图像合成技术的进步。`sketch-rnn`作为一种生成模型，旨在通过学习向量绘图来生成新颖的图像。该模型的研究起源于2017年，由Google的研究人员提出，并随之创建了Aaron Koblin Sheep Market、Kanji Stroke Data和Omniglot Stroke Data三个数据集。这些数据集的构建旨在为`sketch-rnn`提供训练基础，进而促进生成向量图像模型的状态更新。数据集以其独特的*stroke-3*向量格式存储，该格式记录了坐标偏移量和笔的抬起状态，为模型的训练提供了标准化输入。这些数据集的创建，不仅丰富了图像生成领域的研究资源，也为相关领域的研究提供了重要支持。

当前挑战

尽管这些数据集为生成模型的研究提供了坚实基础，但在构建与应用过程中仍面临诸多挑战。首先，数据集的构建需考虑如何有效表示图像的笔画顺序和空间关系，这对于模型的训练至关重要。其次，数据格式从*stroke-3*到*stroke-5*的转换增加了数据处理复杂性。此外，为了提高模型的泛化能力，需要对数据进行简化处理，如采用Ramer-Douglas-Peucker算法，但这又带来了如何选择合适参数以保持图像细节的挑战。最后，如何在保证数据质量的同时，遵循各数据集的版权和许可协议，也是数据集构建者必须面对的问题。

常用场景

经典使用场景

在机器学习与计算机视觉领域，Simple Vector Drawing Datasets数据集被广泛应用于训练生成模型以绘制矢量图像。该数据集的经典使用场景在于，通过训练如sketch-rnn等生成模型，实现对矢量图形的有效学习和再现，进而推动生成矢量图像模型的发展。

实际应用

在实际应用中，该数据集的应用场景广泛，如自动生成艺术作品、辅助设计工作、图像风格转换等领域。通过该数据集训练出的模型能够辅助设计师快速生成草图或创意图形，从而提高设计效率和创作灵活性。

衍生相关工作

基于该数据集，衍生出了众多相关研究工作，如改进的图像生成模型、矢量图像风格化方法等。这些工作不仅推动了生成模型的性能提升，也为计算机艺术领域的发展贡献了新的视角和技术路径。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集