google/quickdraw

Name: google/quickdraw
Creator: google
Published: 2024-08-27 17:11:26
License: 暂无描述

Hugging Face2024-08-27 更新2024-06-15 收录

下载链接：

https://hf-mirror.com/datasets/google/quickdraw

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集名为Quick, Draw!，主要用于图像分类任务。数据集包含大量由众包生成的绘图数据，涵盖了多种物体和场景。数据集为单语种（英语），并提供了多种配置，包括原始数据、简化绘图和位图预处理版本。每个配置都有特定的特征和数据集划分。

This dataset is named Quick, Draw!, which is mainly utilized for image classification tasks. It includes a vast amount of crowdsourced drawing data covering a wide range of objects and scenes. The dataset is monolingual (English) and provides multiple configurations, namely raw drawing data, simplified drawing versions, and bitmap-preprocessed versions. Each configuration has distinct characteristics and dedicated dataset splits.

提供机构：

google

原始信息汇总

数据集概述

基本信息

数据集名称: Quick, Draw!
语言: 英语
许可证: CC BY 4.0
多语言性: 单语种
数据集大小: 10M<n<100M
源数据集: 原始数据
任务类别: 图像分类
任务ID: 多类别图像分类
PapersWithCode ID: quick-draw-dataset

数据集配置

配置名称: raw

特征:
- key_id: 字符串
- word: 类别标签，包含345个类别名称
- recognized: 布尔值
- timestamp: 时间戳（UTC）
- countrycode: 字符串
- drawing: 序列，包含x、y坐标和时间戳t
分割:
- train: 包含50426266个样本，大小为134763164880字节
下载大小: 194810597157字节
数据集大小: 134763164880字节

配置名称: preprocessed_simplified_drawings

特征:
- key_id: 字符串
- word: 类别标签，包含345个类别名称
- recognized: 布尔值
- timestamp: 时间戳（UTC）
- countrycode: 字符串
- drawing: 序列，包含x、y坐标
分割:
- train: 包含50426266个样本，大小为9741454188字节
下载大小: 5889968422字节
数据集大小: 9741454188字节

配置名称: preprocessed_bitmaps

特征:
- image: 图像
- label: 类别标签，包含345个类别名称
分割:
- train: 包含50426266个样本，大小为9741454188字节
下载大小: 5889968422字节
数据集大小: 9741454188字节

搜集汇总

数据集介绍

构建方式

在计算机视觉与手绘识别领域，Quick, Draw! 数据集通过创新的众包方式构建。全球参与者在一款互动游戏中，根据特定词语提示进行简笔画绘制，系统实时记录笔触的坐标序列与时间戳。这一过程生成了超过五千万幅矢量绘图，涵盖345个日常物体类别，每幅绘图均附带绘制者的地理位置与识别结果标签，形成了规模庞大且标注丰富的原始数据源。

特点

该数据集的核心特征在于其独特的矢量序列表示形式，完整保留了绘图的动态过程与时空信息。数据覆盖广泛的语义类别，从简单几何图形到复杂场景，体现了人类绘画的多样性与文化差异。同时，数据集提供原始笔迹、简化矢量及预处理位图三种格式，兼顾了研究灵活性。其庞大的样本量与精细的元数据为探索手绘识别、创意生成及人机交互提供了宝贵资源。

使用方法

研究人员可通过HuggingFace平台直接加载数据集，支持选择原始矢量、简化绘图或位图等不同配置。该数据集适用于监督学习任务，如多类别图像分类，也可用于时序分析或生成模型训练。在使用时，可根据研究需求提取笔触序列、坐标点或转换后的图像，结合国家代码、时间戳等元数据，进行跨文化比较或绘制行为分析，为机器学习模型提供丰富的训练与评估基础。

背景与挑战

背景概述

在人工智能与计算机视觉领域，手绘草图识别作为一项基础且富有挑战性的任务，长期以来受到研究者的广泛关注。谷歌公司于2017年推出的Quick, Draw!数据集，正是这一研究脉络中的重要里程碑。该数据集由谷歌创意实验室主导，通过在线游戏形式，邀请全球用户参与绘制，从而收集了涵盖345个类别的超过5000万幅手绘草图。其核心研究问题聚焦于如何利用大规模、多样化的草图数据，推动草图识别、生成及理解模型的发展。该数据集的问世，不仅为草图识别领域提供了前所未有的丰富资源，还促进了人机交互、创意生成及教育应用等多个方向的创新探索，对相关领域产生了深远影响。

当前挑战

Quick, Draw!数据集旨在解决手绘草图识别与分类的领域问题，其面临的挑战主要体现在草图类内差异大、类间相似性高，以及草图表达的抽象性与多样性上。这些特性使得模型难以准确捕捉关键特征，实现鲁棒分类。在构建过程中，数据集遭遇了多重挑战：如何设计有效的游戏机制以吸引广泛参与并确保数据质量；如何处理来自不同文化背景用户的绘制偏差，保证数据的代表性与公平性；以及如何高效存储与处理海量的时序笔画数据，同时保持数据的原始性与可访问性。这些挑战共同构成了数据集构建与应用中的核心难点。

常用场景

经典使用场景

在计算机视觉与模式识别领域，QuickDraw数据集以其大规模手绘简笔画序列的独特形态，为图像分类任务提供了经典的应用场景。该数据集包含超过五千万幅涵盖345个类别的用户绘制轨迹，其矢量形式的绘图数据不仅捕捉了绘画的动态过程，还保留了丰富的时空信息。研究者常利用这些数据训练深度神经网络，探索模型对抽象视觉概念的识别能力，尤其在处理非真实感图像和草图理解方面展现出卓越价值。

衍生相关工作

围绕该数据集衍生出多项经典研究工作，包括SketchRNN序列生成模型和Sketch-a-Net深度神经网络架构。这些工作开创了基于循环神经网络的草图生成研究分支，启发了后续的草图到图像合成、跨模态草图检索等方向。在元学习领域，该数据集被用作少样本学习任务的基准测试集；在可解释人工智能研究中，其简笔画特性成为可视化神经网络决策过程的理想媒介，催生了系列关于视觉概念表征学习的重要成果。

数据集最近研究