five

google/quickdraw

收藏
Hugging Face2024-08-27 更新2024-06-15 收录
下载链接:
https://hf-mirror.com/datasets/google/quickdraw
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为Quick, Draw!,主要用于图像分类任务。数据集包含大量由众包生成的绘图数据,涵盖了多种物体和场景。数据集为单语种(英语),并提供了多种配置,包括原始数据、简化绘图和位图预处理版本。每个配置都有特定的特征和数据集划分。

This dataset is named Quick, Draw!, which is mainly utilized for image classification tasks. It includes a vast amount of crowdsourced drawing data covering a wide range of objects and scenes. The dataset is monolingual (English) and provides multiple configurations, namely raw drawing data, simplified drawing versions, and bitmap-preprocessed versions. Each configuration has distinct characteristics and dedicated dataset splits.
提供机构:
google
原始信息汇总

数据集概述

基本信息

  • 数据集名称: Quick, Draw!
  • 语言: 英语
  • 许可证: CC BY 4.0
  • 多语言性: 单语种
  • 数据集大小: 10M<n<100M
  • 源数据集: 原始数据
  • 任务类别: 图像分类
  • 任务ID: 多类别图像分类
  • PapersWithCode ID: quick-draw-dataset

数据集配置

配置名称: raw

  • 特征:
    • key_id: 字符串
    • word: 类别标签,包含345个类别名称
    • recognized: 布尔值
    • timestamp: 时间戳(UTC)
    • countrycode: 字符串
    • drawing: 序列,包含x、y坐标和时间戳t
  • 分割:
    • train: 包含50426266个样本,大小为134763164880字节
  • 下载大小: 194810597157字节
  • 数据集大小: 134763164880字节

配置名称: preprocessed_simplified_drawings

  • 特征:
    • key_id: 字符串
    • word: 类别标签,包含345个类别名称
    • recognized: 布尔值
    • timestamp: 时间戳(UTC)
    • countrycode: 字符串
    • drawing: 序列,包含x、y坐标
  • 分割:
    • train: 包含50426266个样本,大小为9741454188字节
  • 下载大小: 5889968422字节
  • 数据集大小: 9741454188字节

配置名称: preprocessed_bitmaps

  • 特征:
    • image: 图像
    • label: 类别标签,包含345个类别名称
  • 分割:
    • train: 包含50426266个样本,大小为9741454188字节
  • 下载大小: 5889968422字节
  • 数据集大小: 9741454188字节
搜集汇总
数据集介绍
main_image_url
构建方式
在计算机视觉与手绘识别领域,Quick, Draw! 数据集通过创新的众包方式构建。全球参与者在一款互动游戏中,根据特定词语提示进行简笔画绘制,系统实时记录笔触的坐标序列与时间戳。这一过程生成了超过五千万幅矢量绘图,涵盖345个日常物体类别,每幅绘图均附带绘制者的地理位置与识别结果标签,形成了规模庞大且标注丰富的原始数据源。
特点
该数据集的核心特征在于其独特的矢量序列表示形式,完整保留了绘图的动态过程与时空信息。数据覆盖广泛的语义类别,从简单几何图形到复杂场景,体现了人类绘画的多样性与文化差异。同时,数据集提供原始笔迹、简化矢量及预处理位图三种格式,兼顾了研究灵活性。其庞大的样本量与精细的元数据为探索手绘识别、创意生成及人机交互提供了宝贵资源。
使用方法
研究人员可通过HuggingFace平台直接加载数据集,支持选择原始矢量、简化绘图或位图等不同配置。该数据集适用于监督学习任务,如多类别图像分类,也可用于时序分析或生成模型训练。在使用时,可根据研究需求提取笔触序列、坐标点或转换后的图像,结合国家代码、时间戳等元数据,进行跨文化比较或绘制行为分析,为机器学习模型提供丰富的训练与评估基础。
背景与挑战
背景概述
在人工智能与计算机视觉领域,手绘草图识别作为一项基础且富有挑战性的任务,长期以来受到研究者的广泛关注。谷歌公司于2017年推出的Quick, Draw!数据集,正是这一研究脉络中的重要里程碑。该数据集由谷歌创意实验室主导,通过在线游戏形式,邀请全球用户参与绘制,从而收集了涵盖345个类别的超过5000万幅手绘草图。其核心研究问题聚焦于如何利用大规模、多样化的草图数据,推动草图识别、生成及理解模型的发展。该数据集的问世,不仅为草图识别领域提供了前所未有的丰富资源,还促进了人机交互、创意生成及教育应用等多个方向的创新探索,对相关领域产生了深远影响。
当前挑战
Quick, Draw!数据集旨在解决手绘草图识别与分类的领域问题,其面临的挑战主要体现在草图类内差异大、类间相似性高,以及草图表达的抽象性与多样性上。这些特性使得模型难以准确捕捉关键特征,实现鲁棒分类。在构建过程中,数据集遭遇了多重挑战:如何设计有效的游戏机制以吸引广泛参与并确保数据质量;如何处理来自不同文化背景用户的绘制偏差,保证数据的代表性与公平性;以及如何高效存储与处理海量的时序笔画数据,同时保持数据的原始性与可访问性。这些挑战共同构成了数据集构建与应用中的核心难点。
常用场景
经典使用场景
在计算机视觉与模式识别领域,QuickDraw数据集以其大规模手绘简笔画序列的独特形态,为图像分类任务提供了经典的应用场景。该数据集包含超过五千万幅涵盖345个类别的用户绘制轨迹,其矢量形式的绘图数据不仅捕捉了绘画的动态过程,还保留了丰富的时空信息。研究者常利用这些数据训练深度神经网络,探索模型对抽象视觉概念的识别能力,尤其在处理非真实感图像和草图理解方面展现出卓越价值。
衍生相关工作
围绕该数据集衍生出多项经典研究工作,包括SketchRNN序列生成模型和Sketch-a-Net深度神经网络架构。这些工作开创了基于循环神经网络的草图生成研究分支,启发了后续的草图到图像合成、跨模态草图检索等方向。在元学习领域,该数据集被用作少样本学习任务的基准测试集;在可解释人工智能研究中,其简笔画特性成为可视化神经网络决策过程的理想媒介,催生了系列关于视觉概念表征学习的重要成果。
数据集最近研究
最新研究方向
在计算机视觉与人工智能领域,QuickDraw数据集作为大规模手绘草图数据库,近年来推动了草图识别与生成的前沿探索。研究焦点已从传统的图像分类转向草图生成模型的优化,结合生成对抗网络与变分自编码器,提升草图合成的多样性与真实性。同时,该数据集在跨模态学习中的应用日益凸显,例如草图到图像检索、草图引导的图像生成,以及草图与自然语言描述的关联建模,这些方向正成为人机交互与创意设计的热点。随着多模态大模型的兴起,QuickDraw为理解视觉概念的形成过程提供了独特视角,对提升AI的抽象思维与创造力具有深远意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作