cj-mills/hagrid-classification-512p-no-gesture-150k

Name: cj-mills/hagrid-classification-512p-no-gesture-150k
Creator: cj-mills
Published: 2023-05-18 06:21:04
License: 暂无描述

Hugging Face2023-05-18 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/cj-mills/hagrid-classification-512p-no-gesture-150k

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: features: - name: image dtype: image - name: label dtype: class_label: names: '0': call '1': dislike '2': fist '3': four '4': like '5': mute '6': no_gesture '7': ok '8': one '9': palm '10': peace '11': peace_inverted '12': rock '13': stop '14': stop_inverted '15': three '16': three2 '17': two_up '18': two_up_inverted splits: - name: train num_bytes: 3805782529 num_examples: 153735 download_size: 3808743954 dataset_size: 3805782529 license: cc-by-sa-4.0 language: - en pretty_name: HaGRID Classification 512p no_gesture 150k size_categories: - 100K<n<1M --- # Dataset Card for "hagrid-classification-512p-no-gesture-150k" This dataset contains 153,735 training images from [HaGRID](https://github.com/hukenovs/hagrid) (HAnd Gesture Recognition Image Dataset) modified for image classification instead of object detection. The original dataset is 716GB. I created this sample for a tutorial so readers can use the dataset in the free tiers of Google Colab and Kaggle Notebooks. ### Original Authors: * [Alexander Kapitanov](https://www.linkedin.com/in/hukenovs) * [Andrey Makhlyarchuk](https://www.linkedin.com/in/makhliarchuk) * [Karina Kvanchiani](https://www.linkedin.com/in/kvanchiani) ### Original Dataset Links * [GitHub](https://github.com/hukenovs/hagrid) * [Kaggle Datasets Page](https://www.kaggle.com/datasets/kapitanov/hagrid)

数据集信息：特征： - 名称：image，数据类型：image（图像） - 名称：label，数据类型：类别标签（class_label）：类别名称： '0': 呼叫（call） '1': 反感（dislike） '2': 拳头（fist） '3': 四指手势（four） '4': 点赞手势（like） '5': 静音手势（mute） '6': 无手势（no_gesture） '7': OK手势（ok） '8': 单指手势（one） '9': 手掌（palm） '10': 和平手势（peace） '11': 反向和平手势（peace_inverted） '12': 摇滚手势（rock） '13': 停止手势（stop） '14': 反向停止手势（stop_inverted） '15': 三指手势（three） '16': 三指变体（three2） '17': 双指上举（two_up） '18': 反向双指上举（two_up_inverted）数据划分： - 名称：训练集（train），字节数：3805782529，样本数量：153735 下载大小：3808743954字节数据集总大小：3805782529字节许可证：CC BY-SA 4.0（知识共享署名-相同方式共享4.0协议）语言：英语（en）展示名称：HaGRID Classification 512p no_gesture 150k 大小分类：100K<n<1M # "hagrid-classification-512p-no-gesture-150k"数据集卡片本数据集包含153735张训练图像，源自HaGRID（HAnd Gesture Recognition Image Dataset，手部手势识别图像数据集），针对图像分类任务而非目标检测任务进行了适配修改。原始数据集总容量达716GB。本样本数据集专为教程制作，方便读者在Google Colab与Kaggle笔记本的免费配额中使用该数据集。 ### 原作者： * [Alexander Kapitanov](https://www.linkedin.com/in/hukenovs) * [Andrey Makhlyarchuk](https://www.linkedin.com/in/makhliarchuk) * [Karina Kvanchiani](https://www.linkedin.com/in/kvanchiani) ### 原始数据集链接 * [GitHub仓库](https://github.com/hukenovs/hagrid) * [Kaggle数据集页面](https://www.kaggle.com/datasets/kapitanov/hagrid)

提供机构：

cj-mills

原始信息汇总

数据集概述

数据集名称

HaGRID Classification 512p no_gesture 150k

数据集特征

image：图像数据
label：类别标签，包括以下类别：
- 0: call
- 1: dislike
- 2: fist
- 3: four
- 4: like
- 5: mute
- 6: no_gesture
- 7: ok
- 8: one
- 9: palm
- 10: peace
- 11: peace_inverted
- 12: rock
- 13: stop
- 14: stop_inverted
- 15: three
- 16: three2
- 17: two_up
- 18: two_up_inverted

数据集拆分

train：训练集，包含153,735个样本，总大小为3,805,782,529字节。

数据集大小

下载大小：3,808,743,954字节
数据集大小：3,805,782,529字节

许可证

cc-by-sa-4.0

语言

大小类别

100K<n<1M

搜集汇总

数据集介绍

构建方式

在计算机视觉领域，手势识别数据集对于人机交互研究至关重要。本数据集源自大规模的HaGRID数据集，原始数据量高达716GB。为适应教学与轻量级实验需求，构建者从中精心筛选并处理了153,735张训练图像，将其分辨率统一调整为512像素，并专门移除了'no_gesture'类别，从而形成了一个专注于18种明确手势的分类任务子集。这一构建过程既保留了原始数据的多样性，又显著降低了存储与计算门槛。

使用方法

研究人员可借助Hugging Face平台便捷加载此数据集，直接应用于图像分类模型的训练与评估。典型工作流程包括使用标准数据加载器读取图像与对应标签，随后可结合卷积神经网络或视觉Transformer等架构进行端到端学习。数据集适用于手势识别、交互系统原型开发及迁移学习研究，其适中的规模也使其能顺畅运行于Google Colab或Kaggle等免费计算环境中，极大便利了算法快速迭代与教育演示。

背景与挑战

背景概述

在计算机视觉领域，手势识别作为人机交互的关键技术，长期依赖于高质量、大规模标注数据集的支持。HaGRID数据集由Alexander Kapitanov、Andrey Makhlyarchuk和Karina Kvanchiani等研究人员于2022年创建，旨在解决手势检测与分类中的现实场景泛化问题。该数据集最初设计用于目标检测任务，包含多样化的手势类别与复杂背景，显著推动了手势识别模型在真实环境中的鲁棒性研究。当前变体‘hagrid-classification-512p-no-gesture-150k’作为其子集，专注于图像分类任务，通过降采样与样本筛选，为学术与教育场景提供了轻量化的实验资源。

当前挑战

手势识别领域长期面临类内差异大、环境干扰多以及实时性要求高等挑战，HaGRID数据集通过涵盖光照变化、手势姿态多样性及背景复杂性，致力于提升模型在实际应用中的稳定性。在构建过程中，原始数据规模达716GB，对存储与计算资源构成显著压力；为适配免费计算平台，本变体需在保持数据代表性的前提下，进行分辨率调整与样本平衡，同时确保‘no_gesture’类别的合理纳入，以避免分类偏差，这一过程涉及精细的数据工程与质量权衡。

常用场景

经典使用场景

在计算机视觉领域，手势识别作为人机交互的核心技术，对数据集的规模与质量提出了严格要求。本数据集源自HaGRID，经过重构专为图像分类任务设计，包含超过15万张标注图像，覆盖18种手势类别。其经典使用场景在于为静态手势分类模型提供训练与评估基准，研究人员可借此构建高效的手势识别系统，推动人机交互界面的智能化发展。

解决学术问题

手势识别研究长期面临数据稀缺、标注不一致等挑战，制约了模型的泛化能力。本数据集通过提供大规模、高质量的手势图像，有效解决了监督学习中的样本不足问题，支持跨场景手势分类算法的开发。其意义在于为学术界建立了标准化的评估平台，促进了深度学习模型在手势识别领域的性能突破，推动了相关理论框架的完善。

实际应用

在实际应用中，本数据集支撑的手势识别技术已广泛应用于智能家居控制、车载交互系统及虚拟现实界面。例如，用户可通过简单手势操作设备，实现非接触式控制，提升交互的自然性与安全性。这些应用不仅优化了用户体验，也为无障碍辅助技术提供了创新解决方案，展现了计算机视觉在现实场景中的实用价值。

数据集最近研究