five

Quick Draw Dataset

收藏
github2018-03-24 更新2024-05-31 收录
下载链接:
https://github.com/sharans003/quickdraw-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
Quick Draw Dataset是一个包含5000万幅绘图的数据集,涵盖345个类别,由游戏Quick, Draw!的玩家贡献。这些绘图以时间戳向量形式捕捉,附带元数据,包括玩家被要求绘制的类别和玩家所在国家的信息。

The Quick Draw Dataset is a collection of 50 million drawings spanning 345 categories, contributed by players of the game Quick, Draw!. These drawings are captured as timestamped vectors, accompanied by metadata including the target category the player was asked to depict and the country where the player was located.
创建时间:
2018-03-01
原始信息汇总

数据集概述

数据集名称

  • The Quick, Draw! Dataset

数据集内容

  • 规模:包含5000万张图画,涵盖345个类别。
  • 来源:由Quick, Draw!游戏玩家贡献。
  • 数据格式
    • 原始数据:以ndjson格式存储,每行包含一个图画,包含关键信息如唯一标识符、提示词、是否被游戏识别、创建时间、国家代码和图画向量。
    • 预处理数据
      • 简化图画文件:简化向量,去除时间信息,调整为256x256区域,仍以ndjson格式存储。
      • 二进制文件:简化图画和元数据的二进制格式,用于高效压缩和加载。
      • Numpy位图文件:所有简化图画渲染为28x28灰度位图,存储为.npy格式。

数据获取

  • 存储位置:Google Cloud Storage。
  • 文件列表
    • 原始文件:按类别分隔的ndjson文件。
    • 简化图画文件:按类别分隔的ndjson文件。
    • 二进制文件:按类别分隔的.bin文件。
    • Numpy位图文件:按类别分隔的.npy文件。

数据使用

  • 目的:供开发者、研究人员和艺术家探索、研究和学习。
  • 相关项目:包括创意艺术项目、数据分析、代码和工具等。

数据集版本更新

  • 最近更新:2017年5月25日,更新Sketch-RNN QuickDraw数据集,创建.full.npz补充集。

许可协议

搜集汇总
数据集介绍
main_image_url
构建方式
Quick Draw Dataset 是由 Quick, Draw! 游戏玩家所绘制的50百万幅画作组成的集合。该数据集的构建方式是通过捕获时间戳记的矢量图,并附上包括玩家被要求绘制的对象和玩家所在国家等元数据标签。这些矢量图按照类别被分成不同的 `ndjson` 文件,每个文件包含一个独特的标识符、提示词、是否被游戏识别、时间戳、国家代码和绘图数据。
使用方法
使用该数据集时,用户可以从Google Cloud Storage下载所需的文件,文件格式包括原始的 `ndjson` 文件、简化的绘图文件、二进制文件和Numpy位图文件。用户可以根据需要选择不同的文件格式进行研究和应用。此外,数据集还提供了用于训练Sketch-RNN模型的处理过的数据。在使用前,用户应确保遵守Creative Commons Attribution 4.0国际许可协议。
背景与挑战
背景概述
Quick Draw Dataset是由Google提供的包含50百万幅绘画的数据集,涵盖345个类别,由参与Quick, Draw!游戏的玩家贡献而成。这些绘画以时间戳记的矢量图形式捕捉,并附有包括玩家被要求绘制的对象和玩家所在国家等元数据标签。该数据集的创建旨在为开发者、研究人员和艺术家提供探索、研究和学习的资源,对于理解人类绘画行为模式及构建相关机器学习模型具有重要的研究价值。
当前挑战
该数据集在研究领域中的挑战主要包括:1) 如何利用这些数据训练出能够准确识别和分类人类手绘图像的机器学习模型;2) 数据构建过程中的挑战,例如处理不同设备导致的绘画尺寸和点的数量的差异,以及确保数据的质量和多样性。此外,数据集可能包含不适当的内容,这要求研究者在使用时进行适当的筛选和处理。
常用场景
经典使用场景
在机器学习和人工智能领域,Quick Draw Dataset被广泛用于图像识别和矢量绘图分类的研究与开发。其经典的使用场景包括利用该数据集训练机器学习模型,以识别和分类用户绘制的简单图形,例如用于开发智能绘图应用程序或游戏。
解决学术问题
该数据集解决了图像识别中的多个学术问题,包括如何处理不同用户绘图风格的多变性、如何优化模型以准确识别形状和图案,以及如何在不同的文化和语言背景下进行有效的图像分类。这些问题的解决对提升机器学习模型的泛化能力和鲁棒性具有重要意义。
实际应用
在实际应用中,Quick Draw Dataset被用于创建和优化各种绘图识别工具,例如智能绘图助手、自动涂鸦识别系统,以及教育平台中的互动学习工具。这些应用使得用户可以轻松绘制图形,并通过智能反馈进行学习和改进。
数据集最近研究
最新研究方向
Quick Draw Dataset作为目前最大的手绘素描数据集,其最新研究方向主要集中于深度学习模型的训练与应用。研究者们利用此数据集训练诸如Sketch-RNN等模型以进行手绘素描的生成和分类,进而探索人类绘画行为背后的认知机制。此外,该数据集也推动了艺术创作、数据分析和可视化等跨学科领域的创新应用,如利用机器学习算法识别和创作艺术作品,分析全球范围内的绘画习惯与模式。这些研究不仅拓宽了人工智能在艺术领域的应用范围,也为心理学、认知科学等领域提供了新的研究视角和数据支持。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作