five

cj-mills/hagrid-classification-512p-no-gesture-150k

收藏
Hugging Face2023-05-18 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/cj-mills/hagrid-classification-512p-no-gesture-150k
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: image dtype: image - name: label dtype: class_label: names: '0': call '1': dislike '2': fist '3': four '4': like '5': mute '6': no_gesture '7': ok '8': one '9': palm '10': peace '11': peace_inverted '12': rock '13': stop '14': stop_inverted '15': three '16': three2 '17': two_up '18': two_up_inverted splits: - name: train num_bytes: 3805782529 num_examples: 153735 download_size: 3808743954 dataset_size: 3805782529 license: cc-by-sa-4.0 language: - en pretty_name: HaGRID Classification 512p no_gesture 150k size_categories: - 100K<n<1M --- # Dataset Card for "hagrid-classification-512p-no-gesture-150k" This dataset contains 153,735 training images from [HaGRID](https://github.com/hukenovs/hagrid) (HAnd Gesture Recognition Image Dataset) modified for image classification instead of object detection. The original dataset is 716GB. I created this sample for a tutorial so readers can use the dataset in the free tiers of Google Colab and Kaggle Notebooks. ### Original Authors: * [Alexander Kapitanov](https://www.linkedin.com/in/hukenovs) * [Andrey Makhlyarchuk](https://www.linkedin.com/in/makhliarchuk) * [Karina Kvanchiani](https://www.linkedin.com/in/kvanchiani) ### Original Dataset Links * [GitHub](https://github.com/hukenovs/hagrid) * [Kaggle Datasets Page](https://www.kaggle.com/datasets/kapitanov/hagrid)

数据集信息: 特征: - 名称:image,数据类型:image(图像) - 名称:label,数据类型: 类别标签(class_label): 类别名称: '0': 呼叫(call) '1': 反感(dislike) '2': 拳头(fist) '3': 四指手势(four) '4': 点赞手势(like) '5': 静音手势(mute) '6': 无手势(no_gesture) '7': OK手势(ok) '8': 单指手势(one) '9': 手掌(palm) '10': 和平手势(peace) '11': 反向和平手势(peace_inverted) '12': 摇滚手势(rock) '13': 停止手势(stop) '14': 反向停止手势(stop_inverted) '15': 三指手势(three) '16': 三指变体(three2) '17': 双指上举(two_up) '18': 反向双指上举(two_up_inverted) 数据划分: - 名称:训练集(train),字节数:3805782529,样本数量:153735 下载大小:3808743954字节 数据集总大小:3805782529字节 许可证:CC BY-SA 4.0(知识共享署名-相同方式共享4.0协议) 语言:英语(en) 展示名称:HaGRID Classification 512p no_gesture 150k 大小分类:100K<n<1M # "hagrid-classification-512p-no-gesture-150k"数据集卡片 本数据集包含153735张训练图像,源自HaGRID(HAnd Gesture Recognition Image Dataset,手部手势识别图像数据集),针对图像分类任务而非目标检测任务进行了适配修改。原始数据集总容量达716GB。本样本数据集专为教程制作,方便读者在Google Colab与Kaggle笔记本的免费配额中使用该数据集。 ### 原作者: * [Alexander Kapitanov](https://www.linkedin.com/in/hukenovs) * [Andrey Makhlyarchuk](https://www.linkedin.com/in/makhliarchuk) * [Karina Kvanchiani](https://www.linkedin.com/in/kvanchiani) ### 原始数据集链接 * [GitHub仓库](https://github.com/hukenovs/hagrid) * [Kaggle数据集页面](https://www.kaggle.com/datasets/kapitanov/hagrid)
提供机构:
cj-mills
原始信息汇总

数据集概述

数据集名称

  • HaGRID Classification 512p no_gesture 150k

数据集特征

  • image:图像数据
  • label:类别标签,包括以下类别:
    • 0: call
    • 1: dislike
    • 2: fist
    • 3: four
    • 4: like
    • 5: mute
    • 6: no_gesture
    • 7: ok
    • 8: one
    • 9: palm
    • 10: peace
    • 11: peace_inverted
    • 12: rock
    • 13: stop
    • 14: stop_inverted
    • 15: three
    • 16: three2
    • 17: two_up
    • 18: two_up_inverted

数据集拆分

  • train:训练集,包含153,735个样本,总大小为3,805,782,529字节。

数据集大小

  • 下载大小:3,808,743,954字节
  • 数据集大小:3,805,782,529字节

许可证

  • cc-by-sa-4.0

语言

  • en

大小类别

  • 100K<n<1M
搜集汇总
数据集介绍
main_image_url
构建方式
在计算机视觉领域,手势识别数据集对于人机交互研究至关重要。本数据集源自大规模的HaGRID数据集,原始数据量高达716GB。为适应教学与轻量级实验需求,构建者从中精心筛选并处理了153,735张训练图像,将其分辨率统一调整为512像素,并专门移除了'no_gesture'类别,从而形成了一个专注于18种明确手势的分类任务子集。这一构建过程既保留了原始数据的多样性,又显著降低了存储与计算门槛。
使用方法
研究人员可借助Hugging Face平台便捷加载此数据集,直接应用于图像分类模型的训练与评估。典型工作流程包括使用标准数据加载器读取图像与对应标签,随后可结合卷积神经网络或视觉Transformer等架构进行端到端学习。数据集适用于手势识别、交互系统原型开发及迁移学习研究,其适中的规模也使其能顺畅运行于Google Colab或Kaggle等免费计算环境中,极大便利了算法快速迭代与教育演示。
背景与挑战
背景概述
在计算机视觉领域,手势识别作为人机交互的关键技术,长期依赖于高质量、大规模标注数据集的支持。HaGRID数据集由Alexander Kapitanov、Andrey Makhlyarchuk和Karina Kvanchiani等研究人员于2022年创建,旨在解决手势检测与分类中的现实场景泛化问题。该数据集最初设计用于目标检测任务,包含多样化的手势类别与复杂背景,显著推动了手势识别模型在真实环境中的鲁棒性研究。当前变体‘hagrid-classification-512p-no-gesture-150k’作为其子集,专注于图像分类任务,通过降采样与样本筛选,为学术与教育场景提供了轻量化的实验资源。
当前挑战
手势识别领域长期面临类内差异大、环境干扰多以及实时性要求高等挑战,HaGRID数据集通过涵盖光照变化、手势姿态多样性及背景复杂性,致力于提升模型在实际应用中的稳定性。在构建过程中,原始数据规模达716GB,对存储与计算资源构成显著压力;为适配免费计算平台,本变体需在保持数据代表性的前提下,进行分辨率调整与样本平衡,同时确保‘no_gesture’类别的合理纳入,以避免分类偏差,这一过程涉及精细的数据工程与质量权衡。
常用场景
经典使用场景
在计算机视觉领域,手势识别作为人机交互的核心技术,对数据集的规模与质量提出了严格要求。本数据集源自HaGRID,经过重构专为图像分类任务设计,包含超过15万张标注图像,覆盖18种手势类别。其经典使用场景在于为静态手势分类模型提供训练与评估基准,研究人员可借此构建高效的手势识别系统,推动人机交互界面的智能化发展。
解决学术问题
手势识别研究长期面临数据稀缺、标注不一致等挑战,制约了模型的泛化能力。本数据集通过提供大规模、高质量的手势图像,有效解决了监督学习中的样本不足问题,支持跨场景手势分类算法的开发。其意义在于为学术界建立了标准化的评估平台,促进了深度学习模型在手势识别领域的性能突破,推动了相关理论框架的完善。
实际应用
在实际应用中,本数据集支撑的手势识别技术已广泛应用于智能家居控制、车载交互系统及虚拟现实界面。例如,用户可通过简单手势操作设备,实现非接触式控制,提升交互的自然性与安全性。这些应用不仅优化了用户体验,也为无障碍辅助技术提供了创新解决方案,展现了计算机视觉在现实场景中的实用价值。
数据集最近研究
最新研究方向
在计算机视觉领域,手势识别作为人机交互的关键技术,正推动着智能设备与虚拟现实应用的革新。基于HaGRID数据集衍生的分类版本,近期研究聚焦于提升模型在复杂背景与光照变化下的鲁棒性,以及探索轻量化网络架构以实现边缘设备的实时部署。该数据集通过提供大规模、多样化的手势图像,促进了深度学习模型在细粒度动作理解方面的进展,相关成果正逐步融入智能驾驶、无障碍交互等热点场景,为构建自然直观的人机界面奠定了坚实的数据基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作