five

Quick, Draw! Dataset|游戏数据数据集|图像识别数据集

收藏
github2020-09-19 更新2024-05-31 收录
游戏数据
图像识别
下载链接:
https://github.com/herneyse21/quickdraw-dataset
下载链接
链接失效反馈
资源简介:
Quick, Draw! 数据集是一个包含5000万幅画作的集合,这些画作来自全球玩家在游戏Quick, Draw!中的贡献。这些画作以时间戳向量的形式捕捉,并附带了包括玩家被要求画的类别和玩家所在国家等元数据。

The Quick, Draw! dataset is a collection of 50 million drawings contributed by players worldwide in the game Quick, Draw!. These drawings are captured as timestamped vectors and come with metadata including the category the player was asked to draw and the player's country.
创建时间:
2020-09-19
原始信息汇总

The Quick, Draw! Dataset 概述

数据集描述

  • 名称: The Quick, Draw! Dataset
  • 内容: 包含5000万幅来自Quick, Draw!游戏玩家的绘画,涵盖345个类别。
  • 数据格式: 绘画以时间戳向量形式捕捉,附带元数据,包括玩家被要求绘制的类别和玩家所在国家。

数据集结构

原始数据集

  • 文件格式: ndjson
  • 数据字段:
    • key_id: 64位无符号整数,唯一标识符。
    • word: 字符串,玩家被提示绘制的类别。
    • recognized: 布尔值,是否被游戏识别。
    • timestamp: 日期时间,绘画创建时间。
    • countrycode: 字符串,玩家所在国家的两字母代码。
    • drawing: 字符串,表示向量绘画的JSON数组。

预处理数据集

  • 简化绘画文件: .ndjson,简化向量,移除时间信息,数据定位和缩放到256x256区域。
  • 二进制文件: .bin,简化绘画和元数据的定制二进制格式。
  • Numpy位图文件: .npy,所有简化绘画渲染为28x28灰度位图。

Sketch-RNN QuickDraw数据集

  • 数据格式: .npz,适用于循环神经网络输入的压缩文件。
  • 数据处理: 使用Ramer-Douglas-Peucker算法简化线条,每个类别存储在单独的.npz文件中。

数据获取

  • 存储位置: Google Cloud Storage
  • 数据集:
    • 原始文件: .ndjson
    • 简化绘画文件: .ndjson
    • 二进制文件: .bin
    • Numpy位图文件: .npy
    • Sketch-RNN数据: .npz

许可证

  • 类型: Creative Commons Attribution 4.0 International license
  • 链接: CC BY 4.0
AI搜集汇总
数据集介绍
main_image_url
构建方式
Quick, Draw! 数据集通过在线游戏“Quick, Draw!”收集了来自全球玩家的5000万幅绘画作品,涵盖345个类别。每幅绘画以时间戳向量形式记录,并附有玩家被要求绘制的主题及其所在国家的元数据。数据经过人工审核,确保内容的适当性,并以NDJSON格式存储,便于后续处理和分析。
特点
该数据集的特点在于其丰富的多样性和广泛的覆盖范围。每幅绘画不仅包含绘制的时间、地点和主题信息,还以向量形式精确记录了绘制的每一笔。数据集经过预处理,提供了简化后的向量、二进制格式以及28x28的灰度位图,极大地方便了机器学习和深度学习的研究与应用。
使用方法
Quick, Draw! 数据集的使用方法灵活多样。用户可以通过Google Cloud Storage下载原始或预处理后的数据,支持NDJSON、二进制和Numpy位图等多种格式。数据集适用于训练和测试绘图分类模型,特别是基于TensorFlow的Sketch-RNN模型。此外,数据集还提供了丰富的示例代码和工具,帮助用户快速上手并进行深入的数据分析和模型训练。
背景与挑战
背景概述
Quick, Draw! Dataset是由Google Creative Lab于2017年发布的一个大规模手绘数据集,旨在推动手绘识别与生成领域的研究。该数据集包含了来自全球玩家在游戏“Quick, Draw!”中绘制的5000万幅手绘图,涵盖345个类别。每幅绘图以时间戳向量的形式记录,并附有玩家所在国家及绘图提示等元数据。该数据集的发布为机器学习、计算机视觉和生成模型等领域的研究提供了丰富的素材,尤其在手绘识别、草图生成和跨文化绘图行为分析等方面具有重要影响力。
当前挑战
Quick, Draw! Dataset在构建和应用过程中面临多重挑战。首先,手绘数据的多样性和复杂性使得模型在识别和生成任务中难以达到高精度,尤其是不同文化背景下的绘图风格差异显著。其次,数据预处理过程中,由于绘图设备的不同,绘图的分辨率和点数差异较大,导致数据标准化和简化过程复杂。此外,尽管数据集经过人工审核,仍可能存在不适当内容,这对模型的鲁棒性提出了更高要求。最后,如何有效利用该数据集进行跨领域研究,如心理学、艺术创作等,仍需进一步探索。
常用场景
经典使用场景
Quick, Draw! Dataset 在机器学习和计算机视觉领域中被广泛用于训练和测试手绘图像识别模型。该数据集包含了来自全球用户的5000万幅手绘图像,涵盖了345个类别,为研究者提供了丰富的样本资源。通过分析这些手绘图像的时间戳和地理位置信息,研究者可以深入探讨不同文化背景下的绘画习惯和风格差异。
实际应用
在实际应用中,Quick, Draw! Dataset 被广泛用于开发智能绘图工具和增强现实应用。例如,基于该数据集训练的模型可以实时识别用户的手绘输入,并将其转化为数字图像或3D模型。此外,该数据集还被用于教育领域,帮助学生通过互动式学习提升绘画技能。
衍生相关工作
Quick, Draw! Dataset 衍生了许多经典的研究工作,如 Sketch-RNN 模型,该模型利用数据集中的手绘图像进行训练,能够生成新的手绘图像。此外,基于该数据集的研究还推动了手绘图像检索和分类算法的发展,如 SketchMate 和 Multi-graph Transformer 等模型,这些工作在计算机视觉和机器学习领域产生了深远影响。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作