Quick, Draw! Dataset

github2019-01-24 更新2024-05-31 收录

下载链接：

https://github.com/DalavanCloud/quickdraw-dataset

下载链接

链接失效反馈

官方服务：

资源简介：

Quick, Draw!数据集是一个包含5000万张来自全球玩家在游戏Quick, Draw!中绘制的图画集合，涵盖345个类别。这些图画以时间戳向量形式捕捉，并附带元数据，包括玩家被要求绘制的类别和玩家所在国家的信息。

The Quick, Draw! dataset is a collection of 50 million drawings created by players worldwide in the game Quick, Draw!, encompassing 345 categories. These drawings are captured as timestamped vectors and come with metadata, including the category the player was asked to draw and the player's country of origin.

创建时间：

2019-01-24

原始信息汇总

数据集概述

数据集名称

The Quick, Draw! Dataset

数据集描述

该数据集包含来自游戏Quick, Draw!玩家的5000万张绘画，涵盖345个类别。这些绘画以时间戳向量形式捕捉，并附带元数据，包括玩家被要求绘制的类别和玩家所在国家。

数据集内容

原始数据：以ndjson格式提供，按类别分隔，包含以下字段：
- key_id：64位无符号整数，唯一标识符
- word：字符串，提示玩家绘制的类别
- recognized：布尔值，是否被游戏识别
- timestamp：日期时间，绘画创建时间
- countrycode：字符串，玩家所在国家的两字母代码
- drawing：字符串，表示向量绘画的JSON数组
预处理数据：
- 简化绘画文件（.ndjson）：简化向量，移除时间信息，数据定位并缩放到256x256区域。
- 二进制文件（.bin）：简化绘画和元数据的定制二进制格式，用于高效压缩和加载。
- Numpy位图文件（.npy）：所有简化绘画已渲染为28x28灰度位图。
Sketch-RNN QuickDraw数据集：用于训练Sketch-RNN模型，包含75K样本，每个类别有自己的.npz文件。

数据获取

数据集可通过Google Cloud Storage获取，提供多种格式的文件，包括原始文件、简化绘画文件、二进制文件和Numpy位图文件。

使用许可

数据集根据Creative Commons Attribution 4.0 International license提供。

搜集汇总

数据集介绍

构建方式

Quick, Draw! Dataset 是由 Quick, Draw! 游戏玩家所绘制的 50 万幅素描组成的集合。该数据集的构建方式是将玩家的绘图动作捕获为时间戳记的矢量图，并附上包括玩家被要求绘制的对象和玩家所在国家等元数据标签。每一幅素描都包含一个唯一的标识符、绘制对象、是否被游戏识别、绘制时间、国家代码和绘制的矢量数据。

特点

该数据集的特点在于其规模庞大、多样性丰富，涵盖了 345 个类别的素描，可为开发人员、研究人员和艺术家提供广泛的研究素材。数据集经过适度审核，但可能仍包含不适当的内容。此外，数据集提供了预处理后的简化绘图文件、二进制文件和 Numpy 位图文件，以满足不同的研究和应用需求。

使用方法

使用者可以通过 Google Cloud Storage 下载该数据集的各种文件格式，包括原始数据文件、简化绘图文件、二进制文件和 Numpy 位图文件。此外，数据集还提供了用于训练 Sketch-RNN 模型的数据。用户可以根据自己的需要选择不同的数据格式，并利用提供的教学和工具来探索和使用这些数据。

背景与挑战

背景概述

Quick, Draw! Dataset是由Google提供的一个包含50万个绘图的数据集，这些绘图涵盖了345个类别，由全球玩家在Quick, Draw!游戏中创作。该数据集的创建旨在为开发者、研究人员和艺术家提供一个探索、研究和学习的资源。每个绘图都由时间戳记的矢量组成，并附有包括绘制提示和玩家所在国家在内的元数据。Quick, Draw! Dataset的发布时间为2016年，主要研究人员来自Google，核心研究问题是如何利用众包的绘图数据进行机器学习模型的训练，其对图像识别、机器学习和数据科学领域产生了重要影响。

当前挑战

该数据集在构建过程中遇到的挑战主要包括：1)如何确保绘图的多样性和质量；2)如何处理和存储大规模的矢量数据；3)如何平衡不同类别之间的数据分布。在所解决的领域问题方面，Quick, Draw! Dataset面临的挑战包括：1)图像分类的准确性；2)模型的泛化能力；3)如何从简化的绘图矢量中提取有效的特征。

常用场景

经典使用场景

Quick, Draw! Dataset作为一款收集了全球玩家绘画数据的数据集，其经典的使用场景主要集中于笔迹识别、分类算法的训练与验证。通过对该数据集的深入挖掘，研究人员能够训练出识别手绘图形的模型，进而应用于在线教育、人机交互以及辅助设计等多个领域。

实际应用

在实际应用中，Quick, Draw! Dataset被广泛用于开发教育软件，例如辅助儿童学习绘画或识别图形；在人机交互领域，该数据集可用于改进手势识别系统；在艺术创作中，艺术家和设计师可以利用数据集中的图案进行创意设计或生成艺术作品。

衍生相关工作

基于Quick, Draw! Dataset，衍生出了一系列相关研究工作，包括Sketch-RNN模型的开发，用于生成新的手绘图案；还有各种数据分析和可视化项目，如探索不同文化背景下的绘图习惯差异等。这些工作不仅推动了绘图识别技术的发展，也扩展了数据集的应用边界。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集