Quick, Draw! Dataset

github2017-05-19 更新2024-05-31 收录

下载链接：

https://github.com/FYXX/quickdraw-dataset

下载链接

链接失效反馈

官方服务：

资源简介：

Quick, Draw!数据集是一个包含5000万幅画作的集合，这些画作来自全球玩家在Quick, Draw!游戏中的贡献。数据集中的画作以时间戳向量的形式捕捉，附带元数据，包括玩家被要求绘制的类别和玩家所在国家的信息。

The Quick, Draw! dataset is a collection of 50 million drawings contributed by players worldwide in the Quick, Draw! game. The drawings in the dataset are captured as timestamped vectors, accompanied by metadata including the category the player was asked to draw and the player's country information.

创建时间：

2017-05-19

原始信息汇总

数据集概述

数据集名称

The Quick Draw Dataset

数据集大小

包含5000万张图画

分类

数据集涵盖345个类别

数据来源

由玩家在Quick, Draw!游戏中贡献

数据格式

原始数据：以ndjson格式存储，每行包含一个图画，包含以下字段：
- key_id：64位无符号整数，唯一标识符
- word：字符串，提示玩家绘制的类别
- recognized：布尔值，表示图画是否被游戏识别
- timestamp：日期时间，图画创建时间
- countrycode：字符串，玩家所在国家的ISO 3166-1 alpha-2代码
- drawing：字符串，表示矢量图画的JSON数组
预处理数据：
- 简化图画文件（.ndjson）：简化矢量，去除时间信息，数据定位和缩放到256x256区域
- 二进制文件（.bin）：简化图画和元数据的定制二进制格式
- Numpy位图（.npy）：28x28灰度位图，使用np.load()加载

数据获取

数据集可在Google Cloud Storage上获取，包括原始文件、简化图画文件、二进制文件和Numpy位图文件。

使用许可

数据集遵循Creative Commons Attribution 4.0 International license。

搜集汇总

数据集介绍

构建方式

Quick, Draw! Dataset 是由Google提供的包含50百万幅绘图的数据集，这些绘图跨越345个类别，由Quick, Draw!游戏的玩家所贡献。该数据集的构建是通过收集并记录玩家根据提示所绘制的图形，以及相应的向量时间戳和包括绘制提示和国家代码在内的元数据信息。

使用方法

使用者可以通过Google Cloud Storage获取该数据集，数据以ndjson文件格式按类别分开存储。此外，数据集还提供了简化的绘图文件、二进制文件和Numpy位图文件等多种格式，可通过相应的解析器和工具加载使用。例如，可以使用Python的np.load()函数加载Numpy位图文件。

背景与挑战

背景概述

Quick, Draw! Dataset是由Google提供的一个包含5000万幅绘图的数据集，跨越345个类别，由Quick, Draw!游戏的玩家所贡献。这些绘图以时间戳记的矢量形式捕获，并附有包括玩家被要求绘制的对象以及玩家所在国家在内的元数据。该数据集的创建旨在为开发者、研究人员和艺术家提供一个探索、研究和学习的资源。Quick, Draw! Dataset的问世，对于图像识别、机器学习和人工智能领域的研究具有重要的推动作用，为相关领域提供了一种全新的数据资源。

当前挑战

尽管Quick, Draw! Dataset在构建时经过个体审核，但数据集中仍可能包含不适当的内容，这是使用该数据集时需要考虑的一大挑战。此外，数据集构建过程中遇到的挑战包括如何处理不同设备上的显示和输入所导致的绘图边界框和点的数量差异，以及如何有效压缩和存储大量的矢量数据。在使用该数据集进行机器学习模型的训练时，还需解决如何准确识别和分类绘图的挑战，以及如何从简化的向量数据中恢复出高质量的图像。

常用场景

经典使用场景

在人工智能与机器学习领域，Quick, Draw! Dataset数据集的经典使用场景主要在于图像识别与生成模型的训练。该数据集包含了大量用户绘制的图像，为模型提供了丰富的学习样本，使得机器能够学习到如何识别和绘制各种对象。

解决学术问题

Quick, Draw! Dataset解决了图像识别研究中样本数量不足、多样性不足的问题。它提供了大量不同类别、风格各异的图像，使得学术研究者在进行图像分类、物体识别等任务时能够获得更为准确和全面的研究成果。此外，该数据集对于研究用户绘图行为、文化差异等方面也具有重要价值。

实际应用

在实际应用中，Quick, Draw! Dataset数据集被广泛用于开发智能绘画应用、辅助绘图工具以及图像识别系统。例如，可以基于此数据集开发能够模仿用户绘画风格的智能绘画机器人，或者用于创建能够识别手绘涂鸦的智能助手。

数据集最近研究