Quick, Draw! Dataset
收藏github2017-05-19 更新2024-05-31 收录
下载链接:
https://github.com/FYXX/quickdraw-dataset
下载链接
链接失效反馈官方服务:
资源简介:
Quick, Draw!数据集是一个包含5000万幅画作的集合,这些画作来自全球玩家在Quick, Draw!游戏中的贡献。数据集中的画作以时间戳向量的形式捕捉,附带元数据,包括玩家被要求绘制的类别和玩家所在国家的信息。
The Quick, Draw! dataset is a collection of 50 million drawings contributed by players worldwide in the Quick, Draw! game. The drawings in the dataset are captured as timestamped vectors, accompanied by metadata including the category the player was asked to draw and the player's country information.
创建时间:
2017-05-19
原始信息汇总
数据集概述
数据集名称
The Quick Draw Dataset
数据集大小
包含5000万张图画
分类
数据集涵盖345个类别
数据来源
由玩家在Quick, Draw!游戏中贡献
数据格式
-
原始数据:以
ndjson格式存储,每行包含一个图画,包含以下字段:key_id:64位无符号整数,唯一标识符word:字符串,提示玩家绘制的类别recognized:布尔值,表示图画是否被游戏识别timestamp:日期时间,图画创建时间countrycode:字符串,玩家所在国家的ISO 3166-1 alpha-2代码drawing:字符串,表示矢量图画的JSON数组
-
预处理数据:
- 简化图画文件(
.ndjson):简化矢量,去除时间信息,数据定位和缩放到256x256区域 - 二进制文件(
.bin):简化图画和元数据的定制二进制格式 - Numpy位图(
.npy):28x28灰度位图,使用np.load()加载
- 简化图画文件(
数据获取
数据集可在Google Cloud Storage上获取,包括原始文件、简化图画文件、二进制文件和Numpy位图文件。
使用许可
数据集遵循Creative Commons Attribution 4.0 International license。
搜集汇总
数据集介绍

构建方式
Quick, Draw! Dataset 是由Google提供的包含50百万幅绘图的数据集,这些绘图跨越345个类别,由Quick, Draw!游戏的玩家所贡献。该数据集的构建是通过收集并记录玩家根据提示所绘制的图形,以及相应的向量时间戳和包括绘制提示和国家代码在内的元数据信息。
使用方法
使用者可以通过Google Cloud Storage获取该数据集,数据以ndjson文件格式按类别分开存储。此外,数据集还提供了简化的绘图文件、二进制文件和Numpy位图文件等多种格式,可通过相应的解析器和工具加载使用。例如,可以使用Python的np.load()函数加载Numpy位图文件。
背景与挑战
背景概述
Quick, Draw! Dataset是由Google提供的一个包含5000万幅绘图的数据集,跨越345个类别,由Quick, Draw!游戏的玩家所贡献。这些绘图以时间戳记的矢量形式捕获,并附有包括玩家被要求绘制的对象以及玩家所在国家在内的元数据。该数据集的创建旨在为开发者、研究人员和艺术家提供一个探索、研究和学习的资源。Quick, Draw! Dataset的问世,对于图像识别、机器学习和人工智能领域的研究具有重要的推动作用,为相关领域提供了一种全新的数据资源。
当前挑战
尽管Quick, Draw! Dataset在构建时经过个体审核,但数据集中仍可能包含不适当的内容,这是使用该数据集时需要考虑的一大挑战。此外,数据集构建过程中遇到的挑战包括如何处理不同设备上的显示和输入所导致的绘图边界框和点的数量差异,以及如何有效压缩和存储大量的矢量数据。在使用该数据集进行机器学习模型的训练时,还需解决如何准确识别和分类绘图的挑战,以及如何从简化的向量数据中恢复出高质量的图像。
常用场景
经典使用场景
在人工智能与机器学习领域,Quick, Draw! Dataset数据集的经典使用场景主要在于图像识别与生成模型的训练。该数据集包含了大量用户绘制的图像,为模型提供了丰富的学习样本,使得机器能够学习到如何识别和绘制各种对象。
解决学术问题
Quick, Draw! Dataset解决了图像识别研究中样本数量不足、多样性不足的问题。它提供了大量不同类别、风格各异的图像,使得学术研究者在进行图像分类、物体识别等任务时能够获得更为准确和全面的研究成果。此外,该数据集对于研究用户绘图行为、文化差异等方面也具有重要价值。
实际应用
在实际应用中,Quick, Draw! Dataset数据集被广泛用于开发智能绘画应用、辅助绘图工具以及图像识别系统。例如,可以基于此数据集开发能够模仿用户绘画风格的智能绘画机器人,或者用于创建能够识别手绘涂鸦的智能助手。
数据集最近研究
最新研究方向
在计算机视觉与机器学习领域,Quick, Draw! Dataset作为一大规模的手绘素描数据集,其最新研究方向主要集中于图像识别、生成模型以及跨文化交流分析。研究人员利用该数据集进行深度学习模型的训练,以实现更准确的素描图像分类和识别。此外,通过Sketch-RNN模型,研究者们致力于生成高质量的手绘图像,推动艺术创作与人工智能技术的结合。同时,该数据集还用于分析不同文化背景下绘图习惯的差异,为跨文化交流研究提供支持。这些研究不仅拓宽了人工智能在艺术领域的应用,也为文化多样性研究提供了新的视角。
以上内容由遇见数据集搜集并总结生成



