Quick, Draw! Dataset

github2018-12-24 更新2024-05-31 收录

下载链接：

https://github.com/huhuigou/quickdraw-dataset

下载链接

链接失效反馈

官方服务：

资源简介：

Quick, Draw!数据集是一个包含5000万幅绘画的集合，涵盖345个类别，由玩家在游戏Quick, Draw!中贡献。这些绘画以时间戳向量的形式捕捉，并附有包括玩家被要求绘制的类别和玩家所在国家的元数据。

The Quick, Draw! dataset is a collection of 50 million drawings spanning 345 categories, contributed by players in the game Quick, Draw!. These drawings are captured as timestamped vectors and are accompanied by metadata including the category the player was asked to draw and the player's country.

创建时间：

2018-07-19

原始信息汇总

数据集概述

数据集名称

The Quick, Draw! Dataset

数据集描述

包含5000万张手绘图，涵盖345个类别。
数据来源于游戏Quick, Draw!的玩家贡献。
每张图以时间戳向量形式存储，包含玩家被要求绘制的类别和玩家所在国家的信息。

数据集内容

原始数据：以.ndjson格式存储，每行包含一个绘图，包含key_id, word, recognized, timestamp, countrycode, drawing等字段。
预处理数据：
- 简化绘图文件：.ndjson格式，简化向量，去除时间信息，数据缩放至256x256区域。
- 二进制文件：.bin格式，用于高效压缩和加载。
- Numpy位图：.npy格式，28x28灰度位图。

数据获取

数据集存储于Google Cloud Storage，可通过Cloud Console访问。
提供多种格式的数据文件，包括原始文件、简化绘图文件、二进制文件和Numpy位图文件。

使用场景

数据集适用于开发者、研究人员和艺术家进行探索、研究和学习。
支持Sketch-RNN模型的训练，该模型用于生成和分类手绘图。

数据集许可

根据Creative Commons Attribution 4.0 International license提供。

搜集汇总

数据集介绍

构建方式

Quick, Draw! Dataset 是由 Quick, Draw! 游戏玩家的贡献构成的，包含345个类别的5000万幅绘图。这些绘图以时间戳记的矢量形式捕获，并附带包括玩家被要求绘制的对象和玩家所在国家在内的元数据。数据集的构建通过将玩家的绘图行为转化为结构化数据，实现了大规模的绘图数据积累。

特点

该数据集的特点在于其规模宏大，覆盖类别广泛，且包含丰富的地理和文化多样性信息。每一幅绘图都伴随着时间戳和地理位置信息，为研究人类绘图行为提供了宝贵的资源。此外，数据集提供了多种预处理格式，如简化的矢量图、二进制文件和Numpy位图，以适应不同的研究需求。

使用方法

用户可以通过Google Cloud Storage获取数据集，数据以不同的文件格式分类存储，便于下载和探索。同时，官方提供了多种工具和教程，帮助用户高效地使用数据集，包括TensorFlow教程和Sketch-RNN模型的实现，以及用于浏览和可视化的工具。

背景与挑战

背景概述

Quick, Draw! Dataset是由Google提供的一个包含5000万幅绘图的数据集，跨越345个类别，由Quick, Draw!游戏的玩家所贡献。这些绘图以时间戳记的矢量形式捕获，并带有包括玩家被要求绘制的内容以及玩家所在国家在内的元数据标签。该数据集的创建旨在为开发者、研究人员和艺术家提供一个探索、研究和学习的资源。Quick, Draw! Dataset的创建时间为2016年，主要研究人员来自Google，其核心研究问题是通过大量的用户生成数据来训练机器学习模型，实现对简单图形的识别。该数据集对图像识别和机器学习领域产生了显著影响，为相关研究提供了宝贵的资源。

当前挑战

尽管Quick, Draw! Dataset在图像识别领域具有重要价值，但其在构建和使用过程中也面临着挑战。首先，数据集的构建过程中需要处理来自不同设备和地区的大量数据，保证数据的质量和一致性是一大挑战。其次，数据集可能包含不适当的内容，尽管经过了单独的审核，但仍需用户在使用时注意内容筛选。此外，如何有效地从大量的数据中提取有用的特征，以及如何利用这些数据训练出准确度更高的模型，也是当前面临的挑战。

常用场景

经典使用场景

Quick, Draw! Dataset作为一款包含50万个绘图数据的数据集，被广泛应用于机器学习模型训练、数据分析和艺术创作等领域。其经典的使用场景在于训练绘图分类器，通过对简化后的绘图数据进行机器学习模型的训练，从而实现对绘图的自动分类。

解决学术问题

该数据集解决了学术研究中如何利用众包数据训练机器学习模型的问题，为研究提供了大量标签丰富、来源多样的绘图数据，有助于深度学习等领域的研究人员开展相关研究。同时，该数据集还包含了时间戳和地理位置信息，为时序分析和地理信息分析提供了可能。

衍生相关工作

基于Quick, Draw! Dataset，衍生出了一系列相关工作，如Sketch-RNN模型的开发，该模型能够生成新的绘图作品。此外，还有许多研究利用该数据集进行了数据分析，探讨了人类绘图行为的特点和模式。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集