five

Quick, Draw! Dataset

收藏
github2019-12-09 更新2024-05-31 收录
下载链接:
https://github.com/retzger/quickdraw-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
Quick, Draw!数据集是一个包含5000万张绘画的数据集,涵盖345个类别,由玩家在游戏Quick, Draw!中贡献。这些绘画被捕获为带有时间戳的向量,并附有元数据,包括玩家被要求绘制的类别以及玩家所在国家的信息。

The Quick, Draw! dataset comprises 50 million drawings across 345 categories, contributed by players in the game Quick, Draw!. These drawings are captured as timestamped vectors accompanied by metadata, including the category the player was asked to draw and the player's country information.
创建时间:
2019-12-09
原始信息汇总

数据集概述

数据集名称

  • 名称: The Quick, Draw! Dataset
  • 别名: Quick Draw Dataset, quickdraw-dataset

数据集描述

  • 内容: 包含5000万张来自345个类别的绘画,由玩家在游戏“Quick, Draw!”中创作。
  • 数据格式: 绘画以时间戳向量形式捕捉,附带元数据,包括玩家被要求绘制的类别和玩家所在国家。
  • 数据结构: 每张绘画包含唯一标识符、类别、是否被游戏识别、创作时间、国家代码和向量表示的绘画。

数据集内容

  • 原始数据: 以ndjson格式提供,按类别分隔。
  • 预处理数据:
    • 简化绘画文件: 简化向量,移除时间信息,数据定位并缩放到256x256区域。
    • 二进制文件: 提供高效的压缩和加载。
    • Numpy位图: 所有简化绘画渲染为28x28灰度位图。

数据集获取

  • 存储位置: 数据集存储在Google Cloud Storage,按类别分隔的ndjson文件。
  • 下载方式: 可通过Google Cloud Console或其他方法访问。

数据集使用

  • 项目示例: 包括艺术创作、数据分析、教程和工具等多个领域的应用。

数据集许可证

  • 许可证: Creative Commons Attribution 4.0 International license.

数据集元数据

  • 提供者: Google
  • 元数据描述: 详细描述了数据集的名称、别名、URL、描述、提供者和许可证。
搜集汇总
数据集介绍
main_image_url
构建方式
Quick, Draw! Dataset 是由 Google 提供的一个包含 50,000,000 幅绘图的数据集,涵盖 345 个类别。该数据集是通过 Quick, Draw! 游戏的玩家贡献的。每幅绘图都捕获为带时间戳的向量,并附有包括绘图提示和玩家所在国家在内的元数据。构建过程中,数据以 ndjson 文件格式分类存储,每行包含一幅绘图的唯一标识符、绘图类别、是否被游戏识别、时间戳、国家代码和绘图向量。
特点
此数据集的特点在于其庞大的规模和多样化的绘图类别。所有绘图均由玩家实时绘制,因此包含了丰富的动态信息。此外,数据集还提供了预处理后的简化绘图文件,包括去除时间信息、定位和缩放至 256x256 区域的向量,以及转换为 28x28 灰度位图的文件。数据集还提供了适用于递归神经网络输入的 Sketch-RNN 版本的绘图数据。
使用方法
用户可以通过 Google Cloud Storage 获取数据集,数据以 ndjson、二进制和 Numpy 位图格式提供。对于开发者、研究人员和艺术家,可以利用这些数据来探索、研究和学习。数据集的使用方法包括直接下载、使用命令行工具、在 TensorFlow 中进行绘图分类训练等。此外,还有多个开源项目和工具可供使用和扩展。
背景与挑战
背景概述
The Quick, Draw! Dataset,这是一个由Google推出的数据集,收集了全球玩家在Quick, Draw!游戏中贡献的5000万幅画作,跨越345个类别。这些画作以时间戳向量的形式捕获,并附有包括玩家被要求画什么以及玩家所在国家等元数据。该数据集的创建旨在为开发者、研究人员和艺术家提供一个探索、研究和学习的资源。Quick, Draw! Dataset的创建时间为2016年,主要研究人员为Google团队。
当前挑战
尽管Quick, Draw! Dataset在构建时经过个体审核,但仍可能包含不适当的内容。此外,数据集构建过程中的挑战包括如何处理不同设备上的显示和输入导致的原始画作在边界框大小和点数上的巨大差异,以及如何通过预处理简化向量、去除时间信息并将数据定位和缩放到256x256区域。
常用场景
经典使用场景
The Quick, Draw! Dataset作为一项收集了全球玩家绘画数据的重要资源,其经典使用场景主要集中于机器学习领域的模型训练与算法验证。研究人员可利用该数据集训练出能够识别简单图形的机器学习模型,进而推广至更复杂的图像识别任务,如自然场景理解等。
实际应用
在实际应用中,The Quick, Draw! Dataset可用于开发教育软件,帮助儿童学习绘画,或者用于创建智能绘图辅助工具,为艺术家和设计师提供创作灵感。此外,该数据集亦可用于人机交互领域,优化手势识别系统。
衍生相关工作
基于The Quick, Draw! Dataset,衍生出了多项相关研究工作。例如,Sketch-RNN模型的训练与开发,该模型能够生成新的绘画作品,并在艺术创作与机器学习领域产生了广泛的影响。此外,还有诸多研究利用该数据集探讨了绘图行为背后的心理学特征与文化差异。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作