QuickDraw

github2024-09-18 更新2024-09-24 收录

下载链接：

https://github.com/WangLeYuu/QuickDraw-DDP

下载链接

链接失效反馈

官方服务：

资源简介：

QuickDraw数据集包含340个类别的简单笔画图像，用于图像分类任务。该数据集由Kaggle提供，包含约5000万张图像，适用于训练和验证图像分类模型。

The QuickDraw Dataset consists of simple sketch images across 340 categories, designed for image classification tasks. Hosted by Kaggle, this dataset contains approximately 50 million images and is suitable for training and validating image classification models.

创建时间：

2024-09-18

原始信息汇总

QuickDraw-DDP 数据集概述

数据集特点

迁移学习：使用 QuickDraw 数据集中的 340 个类别训练 MobileNetv3 模型。
分布式训练：提供多卡训练代码。

数据集准备

数据来源：从 Kaggle 下载 Quick, Draw! Doodle Recognition Challenge 数据集。
数据格式转换：将所有类别的 CSV 格式文件保存为 PNG 图像格式。
数据提取：从 340 个类别中提取 10000 张 PNG 格式图像用于后续实践。
数据分割：将每类 10000 条数据的训练集、验证集和测试集按 8:1:1 比例划分。

数据处理

CSV 转 PNG：使用 csv2png.py 脚本将 CSV 数据转换为 PNG 图像格式。
检查图像：使用 check_class_num.py 脚本检查未处理的类别。
数据分割：使用 split_datasets.py 脚本获取分割后的数据集。

模型训练

参数设置：在 option.py 中定义训练所需的参数。
数据生成器：在 getdata.py 中定义数据生成器。
网络修改：在 model.py 中定义模型，并修改分类器层的输出为类别数量。
训练模型：使用 train-DDP.py 脚本进行多卡分布式训练。

模型转换与评估

模型转换：使用 model_transfer.py 脚本将 PTH 模型转换为 PTL 和 ONNX 格式。
模型评估：使用 evaluate.py 脚本进行单张图像和文件夹图像的预测。

许可证

本项目基于 Apache 2.0 许可证。

搜集汇总

数据集介绍

构建方式

QuickDraw数据集的构建基于Kaggle平台上的'Quick, Draw! Doodle Recognition Challenge'竞赛。该数据集从竞赛中提取了340个类别的简笔画数据，每个类别包含10000张PNG格式的图像。这些图像由CSV文件转换而来，原始数据量庞大，处理时间较长。数据集的构建过程包括将CSV数据转换为PNG格式、分割训练集、验证集和测试集，比例为8:1:1。此外，数据集的图像尺寸可根据需求调整为256x256、128x128或64x64，以适应不同的存储和计算需求。

使用方法

使用QuickDraw数据集时，首先需从Kaggle下载原始数据，并使用提供的脚本将CSV文件转换为PNG格式。随后，通过运行split_datasets.py脚本，将数据集分割为训练集、验证集和测试集。在定义模型参数和数据生成器后，用户可以利用提供的多卡训练代码进行分布式训练。训练完成后，可通过model_transfer.py脚本将模型转换为PTL和ONNX格式，便于在移动设备上部署。最后，使用evaluate.py脚本对模型进行评估，验证其性能。

背景与挑战

背景概述

QuickDraw数据集由Google Creative Lab于2017年创建，旨在通过收集全球用户在Google的'Quick, Draw!'游戏中的涂鸦，构建一个大规模的手绘图像数据集。该数据集包含超过5000万张图像，涵盖340个类别，主要用于研究手绘图像的自动识别和分类。QuickDraw的推出极大地推动了计算机视觉领域的发展，特别是在手绘图像识别和深度学习模型的训练方面，为研究人员提供了丰富的数据资源。

当前挑战

QuickDraw数据集在构建过程中面临诸多挑战。首先，数据量庞大，处理5000万张图像需要大量的计算资源和时间。其次，图像质量参差不齐，用户绘制的涂鸦可能存在模糊、不完整等问题，增加了分类的难度。此外，数据集的多样性也是一个挑战，不同用户绘制的同一类别图像可能存在显著差异，如何有效提取特征并进行准确分类是一个复杂的问题。最后，数据集的构建和处理过程中需要考虑数据隐私和用户同意的问题，确保数据的合法性和合规性。

常用场景

经典使用场景

QuickDraw数据集在计算机视觉领域中被广泛应用于手绘图像的分类任务。其经典使用场景包括通过迁移学习训练MobileNetv3模型，以识别来自340个类别的简笔画图像。该数据集的高质量图像数据为模型提供了丰富的训练样本，使得模型在手绘图像识别任务中表现出色。

解决学术问题

QuickDraw数据集解决了手绘图像识别中的多个学术研究问题，如图像分类的准确性提升、模型泛化能力的增强以及大规模数据集的有效利用。通过提供多样化的手绘图像，该数据集促进了深度学习模型在非结构化数据上的表现，推动了计算机视觉领域的发展。

实际应用

在实际应用中，QuickDraw数据集被用于开发智能手绘识别系统，如儿童教育应用中的绘画识别、艺术创作辅助工具以及手势识别系统。这些应用通过利用数据集中的丰富图像数据，提升了用户体验和系统的智能化水平。

数据集最近研究