Quick, Draw! Dataset

github2018-07-24 更新2024-05-31 收录

下载链接：

https://github.com/giterliu/quickdraw-dataset

下载链接

链接失效反馈

官方服务：

资源简介：

Quick, Draw! 数据集是一个包含5000万幅绘画的集合，涵盖345个类别，由玩家在游戏中创作。这些绘画以时间戳向量的形式捕获，并附有包括玩家被要求绘画的内容和玩家所在国家的元数据。

The Quick, Draw! dataset is a collection of 50 million drawings spanning 345 categories, created by players in a game. These drawings are captured as timestamped vectors and are accompanied by metadata including what the players were asked to draw and the countries of the players.

创建时间：

2018-07-24

原始信息汇总

数据集概述

数据集名称

The Quick, Draw! Dataset

数据集大小

包含5000万张绘画作品。

分类

数据集涵盖345个类别。

数据来源

由玩家在Quick, Draw!游戏中创作。

数据格式

原始数据: 以ndjson格式存储，每行包含一个绘画作品，包含关键ID、类别、是否被识别、时间戳、国家代码和绘画向量。
预处理数据:
- 简化绘画文件: 以ndjson格式存储，简化向量，移除时间信息，数据定位并缩放到256x256区域。
- 二进制文件: 以.bin格式存储，用于高效压缩和加载。
- Numpy位图: 以.npy格式存储，所有简化绘画渲染为28x28灰度位图。

数据获取

数据集可通过Google Cloud Storage获取，包括原始文件、简化绘画文件、二进制文件和Numpy位图文件。

Sketch-RNN QuickDraw数据集

用于训练Sketch-RNN模型，数据存储为压缩的.npz文件，适合输入到循环神经网络。

许可证

数据集遵循Creative Commons Attribution 4.0 International license。

搜集汇总

数据集介绍

构建方式

Quick, Draw! Dataset 是由 Quick, Draw! 游戏玩家的贡献构成的，包含345个类别的5000万幅绘画作品。这些绘画作品以时间戳记的矢量形式捕获，并附有包括玩家被要求绘制的对象和玩家所在国家在内的元数据标签。数据集的构建采取了将玩家的绘画动作转化为矢量数据，并对每幅画作进行分类和标记，从而形成了这一大规模的绘画数据集。

特点

该数据集的特点在于其规模庞大、类别丰富，覆盖了来自世界各地的玩家所绘制的作品。每幅画作都包含了时间戳、地理位置和识别信息等元数据，为研究人类绘画习惯、模式识别等领域提供了宝贵的资源。此外，数据集提供了多种格式，包括原始的ndjson文件、简化的ndjson文件、二进制文件和Numpy位图文件，以适应不同的应用场景和需求。

使用方法

使用该数据集时，用户可以根据需要选择不同的数据格式。可以通过Google Cloud Storage获取数据，支持多种访问方式。数据集提供了相应的解析工具和教程，以便用户能够轻松加载和处理数据。此外，数据集还支持通过TensorFlow等框架进行模型训练，为机器学习和人工智能领域的研究提供了便利。

背景与挑战

背景概述

Quick, Draw! Dataset是一款由谷歌推出的大型手绘数据集，包含345个类别的5000万张手绘图像，这些图像由参与Quick, Draw!游戏的玩家贡献。该数据集的创建旨在为开发者、研究人员和艺术家提供一个探索、研究和学习的资源库。Quick, Draw! Dataset的构建时间为2017年，主要研究人员为谷歌团队。该数据集的核心研究问题是捕捉和解析人类的手绘行为，其对机器学习和人工智能领域，特别是在图像识别和手绘生成模型方面产生了显著影响。

当前挑战

该数据集在构建过程中遇到的挑战主要包括：1)确保图像的多样性和准确性，因为图像来源于不同国家和地区的玩家，存在文化差异和多样性；2)图像的标注和分类，由于手绘图像的多样性，标注和分类工作极具挑战；3)数据预处理，包括图像的标准化、向量化以及简化处理，以适应不同的算法和模型需求。此外，所解决的领域问题——图像分类——面临的挑战包括如何提高模型的泛化能力，以及如何从简化后的图像中提取有效特征。

常用场景

经典使用场景

Quick, Draw! Dataset作为一款含有50万个绘画作品的数据库，其经典使用场景在于为机器学习模型提供海量的训练数据，进而训练出能够识别手绘涂鸦的模型。该数据集被广泛运用于图像识别、分类任务中，例如，通过深度学习算法识别并分类用户绘制的简单图形。

实际应用

在实际应用中，Quick, Draw! Dataset被用于开发各种交互式应用程序，如在线绘画识别游戏，以及辅助教育工具，帮助儿童学习绘画和识别图形。此外，该数据集也应用于艺术创作中，艺术家和数据分析师通过分析数据集，创作出新颖的艺术作品和视觉化展示。

衍生相关工作

基于Quick, Draw! Dataset，衍生出了众多相关工作。例如，Sketch-RNN模型的开发，它能够生成新的手绘涂鸦。此外，还有许多研究项目和艺术项目利用此数据集进行了深入的分析和创作，如Letter collages和Faces of Humanity等，这些项目不仅推动了学术研究的进展，也丰富了艺术创作的形式。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集