hagrid-subset

Hugging Face2026-01-11 更新2026-01-12 收录

下载链接：

https://huggingface.co/datasets/neilrigaud/hagrid-subset

下载链接

链接失效反馈

官方服务：

资源简介：

HaGRID手势识别子集是HaGRID（手势识别图像数据集）的一个精选子集，包含24个手势类别，用于训练手势识别模型。数据集总共有19,200张图像，每个类别有800个样本，图像格式为JPEG，平均大小约为302 KB。数据集分为训练集（76%）、验证集（9%）和测试集（15%）。手势类别包括呼叫、不喜欢、拳头、四、抓取、握紧、喜欢、中指、静音、无手势、OK、一、手掌、和平、倒置和平、指向、摇滚、停止、倒置停止、三、三2、三3、两上和倒置两上。数据集结构包括训练、验证和测试目录，以及一个包含19,200条目的注释文件。数据集创建时使用了分层抽样以保持训练/验证/测试比例和类别平衡。数据集验证状态为完全验证，注释覆盖率为100%。许可证为MIT许可证（继承自原始HaGRID数据集）。

The HaGRID Gesture Recognition Subset is a curated subset of the HaGRID (Hand Gesture Recognition Image Dataset), containing 24 gesture categories for training gesture recognition models. The dataset has a total of 19,200 JPEG-format images, with 800 samples per category and an average size of approximately 302 KB. It is split into three subsets: the training set (76%), validation set (9%), and test set (15%). The gesture categories include: call, dislike, fist, four, grab, hold, like, middle finger, mute, no gesture, OK, one, palm, peace, inverted peace, point, rock, stop, inverted stop, three, three2, three3, two fingers up, and inverted two fingers up. The dataset structure includes training, validation, and test directories, as well as an annotation file with 19,200 entries. Stratified sampling was used during dataset creation to maintain the training/validation/test split ratio and ensure category balance. The dataset is fully validated with 100% annotation coverage. The license is the MIT License, inherited from the original HaGRID dataset.

创建时间：

2026-01-06

原始信息汇总

HaGRID Gesture Recognition Subset 数据集概述

数据集基本信息

数据集名称：HaGRID Gesture Recognition Subset
许可证：MIT License
任务类别：图像分类、目标检测
标签：手势识别、计算机视觉、手部手势
数据规模：10K<n<100K
图像总数：19,200
手势类别数：24
每类样本数：800
图像格式：JPEG
平均图像大小：约302 KB

数据集划分

划分	图像数量	百分比
训练集	14,592	76%
验证集	1,728	9%
测试集	2,880	15%

手势类别列表

call
dislike
fist
four
grabbing
grip
like
middle_finger
mute
no_gesture
ok
one
palm
peace
peace_inverted
point
rock
stop
stop_inverted
three
three2
three3
two_up
two_up_inverted

数据集结构

data/ ├── train/ │ ├── call/ (608 images) │ ├── dislike/ (608 images) │ └── ... ├── val/ │ └── ... └── test/ └── ... annotations.csv (19,200 entries)

使用方法

使用 Hugging Face Datasets 加载

python from datasets import load_dataset dataset = load_dataset("YOUR_USERNAME/hagrid-subset") train_data = dataset["train"] val_data = dataset["validation"] test_data = dataset["test"]

使用 Pandas 加载

python import pandas as pd from PIL import Image df = pd.read_csv("hf://datasets/YOUR_USERNAME/hagrid-subset/annotations.csv") train_df = df[df[split] == train]

引用信息

如需使用本数据集，请引用原始 HaGRID 数据集： bibtex @inproceedings{hagrid2022, title={HaGRID--HAnd Gesture Recognition Image Dataset}, author={Kapitanov, Alexander and Kvanchiani, Karina and Nagaev, Alexander and Kraynov, Andrey and Makhliarchuk, Maxim}, booktitle={2022 International Conference on Robotics and Artificial Intelligence (ICRAI)}, year={2022} }

数据集创建与验证

创建方式：采用分层抽样方法创建，以保持训练/验证/测试集的比例并确保类别平衡。
验证状态：✅ 完全验证，注释覆盖率为100%

搜集汇总

数据集介绍

构建方式

在计算机视觉领域，手势识别数据集对于推动人机交互技术的发展至关重要。HaGRID子集作为HaGRID数据集的精选版本，通过分层抽样方法构建，确保了训练集、验证集和测试集之间的比例协调，同时维持了类别平衡。该子集从原始数据集中提取了24个手势类别，每个类别包含800张图像，总计19,200张JPEG格式图像，平均每张图像大小约为302KB。数据集的构建过程经过全面验证，注释覆盖率达到100%，为模型训练提供了高质量的基础。

使用方法

在计算机视觉应用中，该数据集的使用方法多样且易于集成。通过Hugging Face Datasets库，用户可直接加载数据集，并访问训练、验证和测试分割，简化了数据预处理流程。此外，利用Pandas库读取CSV注释文件，结合PIL进行图像处理，可实现自定义数据加载。数据集支持图像分类和对象检测任务，为手势识别模型的开发与评估提供了标准化平台，促进了相关研究的可重复性。

背景与挑战

背景概述

在计算机视觉与人机交互领域，手势识别技术作为自然交互的核心组成部分，其发展依赖于高质量、大规模标注数据集的支撑。HaGRID子集数据集源于2022年由Kapitanov等人发布的HaGRID手势识别图像数据集，旨在为手势识别模型提供精炼的训练资源。该子集精选了24类常见手势，涵盖从基本指令如‘呼叫’、‘静音’到复杂手势如‘摇滚’、‘倒置和平’等，共计19,200张图像，每类样本均衡分布。数据集的构建采用了分层抽样策略，确保了训练、验证与测试集之间的比例协调与类别平衡，其发布显著推动了手势识别模型在鲁棒性与泛化能力方面的研究进展，为人机交互、增强现实及智能驾驶等应用场景提供了关键数据基础。

当前挑战

手势识别领域面临的核心挑战在于模型对复杂背景、光照变化及手部姿态多样性的适应能力，要求数据集能够充分捕捉这些现实场景中的变异。HaGRID子集虽通过类别平衡与数据分层缓解了部分问题，但在构建过程中仍需应对手势类间相似性高（如‘三’与‘三2’、‘三3’）导致的分类模糊性，以及手势执行中的个体差异与文化语境影响所带来的标注一致性难题。此外，数据集的规模虽经优化，但对于深度学习模型而言，仍需扩展以覆盖更广泛的手势变体与多模态交互场景，从而提升模型在真实环境中的部署效果。

常用场景

经典使用场景

在计算机视觉领域，手势识别作为人机交互的核心技术，其发展依赖于高质量、多样化的数据集。HaGRID子集凭借其精心挑选的24种手势类别和均衡的样本分布，为手势识别模型的训练与评估提供了标准化基准。该数据集常被用于训练卷积神经网络或视觉变换器模型，以识别如“呼叫”、“点赞”、“握拳”等日常手势，推动手势分类算法在准确率与鲁棒性方面的进步。

解决学术问题

手势识别研究长期面临数据稀缺、类别不平衡以及背景干扰等挑战。HaGRID子集通过提供大规模、标注精确且类别均衡的图像数据，有效缓解了数据偏差问题，支持学术界探索小样本学习、域适应及噪声鲁棒性等前沿课题。其结构化划分促进了模型泛化能力的客观评估，为手势识别领域的算法创新奠定了实证基础。

实际应用

基于视觉的手势识别技术已广泛应用于智能家居、车载系统、虚拟现实及无障碍交互等场景。利用HaGRID子集训练的模型能够实现非接触式设备控制，例如通过手势调节音量、切换界面或发送指令，提升用户体验与操作安全性。该数据集还为工业自动化中的手势指令系统提供了训练资源，助力人机协作的效率与自然性。

数据集最近研究