five

Quick, Draw! Dataset

收藏
github2017-11-08 更新2024-05-31 收录
下载链接:
https://github.com/carvrodrigo/quickdraw-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
Quick, Draw!数据集是一个包含5000万绘画的集合,涵盖345个类别,由游戏Quick, Draw!的玩家贡献。这些绘画以时间戳向量形式捕捉,附带元数据,包括玩家被要求绘制的类别和玩家所在国家的信息。

The Quick, Draw! dataset is a collection of 50 million drawings spanning 345 categories, contributed by players of the game Quick, Draw!. These drawings are captured as timestamped vectors, accompanied by metadata that includes the category the player was asked to draw and the country of the player.
创建时间:
2017-11-08
原始信息汇总

数据集概述

数据集名称

The Quick, Draw! Dataset

数据集描述

该数据集包含5000万张来自Quick, Draw!游戏玩家的绘画作品,涵盖345个类别。这些绘画以时间戳向量的形式捕获,并附带元数据,包括玩家被要求绘制的类别和玩家所在国家的信息。

数据集内容

  • 原始数据集:以ndjson格式提供,每个类别单独文件,包含以下字段:

    • key_id:64位无符号整数,唯一标识符。
    • word:字符串,提示玩家绘制的类别。
    • recognized:布尔值,表示类别是否被游戏识别。
    • timestamp:日期时间,绘制时间。
    • countrycode:字符串,玩家所在国家的ISO 3166-1 alpha-2代码。
    • drawing:字符串,表示向量绘制的JSON数组。
  • 预处理数据集

    • 简化绘图文件.ndjson):简化向量,移除时间信息,数据调整为256x256区域。
    • 二进制文件.bin):简化绘图和元数据的定制二进制格式。
    • Numpy位图文件.npy):所有简化绘图渲染为28x28灰度位图。
  • Sketch-RNN QuickDraw数据集:用于训练Sketch-RNN模型的数据,存储为压缩的.npz文件。

数据获取

数据集可通过Google Cloud Storage获取,包括原始文件、简化绘图文件、二进制文件和Numpy位图文件,均按类别分隔。

数据集用途

该数据集供开发者、研究人员和艺术家用于探索、研究和学习。使用该数据集的项目包括创意和艺术项目、数据分析以及代码和工具开发。

许可协议

数据集根据Creative Commons Attribution 4.0 International license提供。

搜集汇总
数据集介绍
main_image_url
构建方式
Quick, Draw! Dataset 是通过集合 Quick, Draw! 游戏玩家的绘画作品构建而成的。该数据集包含了50百万幅绘图,涵盖了345个类别。这些绘图以时间戳记的矢量形式捕获,并附有包括玩家被要求绘制的对象以及玩家所在国家在内的元数据标签。构建过程中,数据通过玩家贡献、时间戳记、矢量绘图和地理位置信息等维度进行了整合。
特点
该数据集的特点在于其规模宏大、类别丰富,且包含了详细的元数据信息。每一幅绘图都以独特的64位无符号整数标识,并伴有提示词、识别状态、时间戳、国家代码等元数据。此外,数据集经过了预处理,提供了简化的矢量绘图、二进制文件和Numpy位图格式,以适应不同的研究和应用需求。
使用方法
用户可以通过Google Cloud Storage获取该数据集,数据以类别划分,支持多种格式下载。对于开发者、研究人员和艺术家而言,可以通过阅读相关文档和示例代码,学习如何读取ndjson、bin和npy格式的文件,以及如何利用这些数据进行研究、开发和创作。
背景与挑战
背景概述
Quick, Draw! Dataset 是由Google提供的包含了5000万幅绘图的数据集,跨越345个类别,由Quick, Draw!游戏的玩家所贡献。这些绘图以时间戳记的矢量形式捕获,并附有包括玩家被要求绘制的对象以及玩家所在国家在内的元数据。该数据集的创建旨在为开发者、研究人员和艺术家提供一个探索、研究和学习的资源。Quick, Draw! Dataset 的创建时间为2016年,主要研究人员为Google团队,其核心研究问题是探索如何利用众包方式快速收集大量手绘图像数据,对机器学习领域的图像识别和生成模型训练具有显著影响。
当前挑战
该数据集在构建过程中遇到的挑战主要包括:确保图像数据的多样性和质量,处理不同设备输入导致的绘图矢量数据的差异,以及众包数据中可能存在的不适当内容。在所解决的领域问题方面,Quick, Draw! Dataset 面临的挑战包括如何提高模型对手绘图像的识别准确度,以及如何从简单的手绘笔迹中生成复杂且准确的图像。此外,数据集的预处理和简化也带来了如何保持绘图细节与简化表示之间的平衡问题。
常用场景
经典使用场景
Quick, Draw! Dataset 是一款集成了50 million 幅绘画作品的数据集,涵盖345个类别,由Quick, Draw!游戏的玩家所贡献。该数据集的使用场景广泛,其经典使用场景在于对绘画作品的识别与分类,研究者可以通过该数据集训练机器学习模型,实现对绘画作品的自动分类和识别,进而推动图像识别领域的发展。
实际应用
在实际应用中,Quick, Draw! Dataset 可用于开发各种图像识别和生成相关的应用程序,如智能绘画辅助工具、图像搜索系统、教育娱乐软件等。此外,艺术家和设计师也可以利用此数据集进行创意艺术项目的创作,拓宽艺术表现手法。
衍生相关工作
基于Quick, Draw! Dataset,已经衍生出了一系列相关的研究工作,包括但不限于利用该数据集训练的Sketch-RNN模型,该模型能够生成新的手绘图像。此外,还有多项研究通过分析数据集中的绘画作品,探讨了人类绘画行为的特点和模式。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作