cj-mills/hagrid-sample-500k-384p
收藏Hugging Face2023-07-03 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/cj-mills/hagrid-sample-500k-384p
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为HaGRID Sample 500k 384p,包含从HaGRID(HAnd Gesture Recognition Image Dataset)中抽取的509,323张图像,并缩放到384p分辨率。原始数据集包含552,992张1080p图像,大小为716GB。此样本数据集是为了教程目的而创建,以便读者可以在Google Colab和Kaggle Notebooks的免费层级中使用。数据集主要用于对象检测任务,包含19种手势类别。每个图像都有标注,包括边界框(bboxes)、标签(labels)、主导手(leading_hand)、主导手置信度(leading_conf)和用户ID(user_id)。
This dataset, named HaGRID Sample 500k 384p, comprises 509,323 images resized to 384p resolution sampled from HaGRID (HAnd Gesture Recognition Image Dataset). The original HaGRID dataset contains 552,992 1080p-resolution images with a total size of 716 GB. This sample dataset was created for tutorial purposes, enabling users to utilize it on the free tiers of Google Colab and Kaggle Notebooks. It is primarily intended for object detection tasks and covers 19 gesture categories. Each image is paired with annotations including bounding boxes (bboxes), labels, leading_hand, leading_conf, and user_id.
提供机构:
cj-mills
原始信息汇总
数据集概述
- 许可证: cc-by-sa-4.0
- 任务类别: 物体检测
- 语言: 英语
- 大小类别: 100K<n<1M
- 美观名称: HaGRID Sample 500k 384p
数据集内容
- 图像数量: 509,323
- 图像分辨率: 384p
- 原始数据集大小: 716GB
- 原始图像数量: 552,992
- 原始图像分辨率: 1080p
对象类别
text [call, no_gesture, dislike, fist, four, like, mute, ok, one, palm, peace, peace_inverted, rock, stop, stop_inverted, three, three2, two_up, two_up_inverted]
注释格式
- 边界框:
[top-left-X-position, top-left-Y-position, width, height] - 计算方式: 将
top-left-X-position和width乘以图像宽度,将top-left-Y-position和height乘以图像高度。
示例注释
| bboxes | labels | leading_hand | leading_conf | user_id | |
|---|---|---|---|---|---|
| 0 | [[0.23925175, 0.28595301, 0.25055143, 0.20777627]] | [call] | right | 1 | 5a389ffe1bed6660a59f4586c7d8fe2770785e5bf79b09334aa951f6f119c024 |
搜集汇总
数据集介绍

构建方式
HaGRID Sample 500k 384p数据集是从HaGRID(HAnd Gesture Recognition Image Dataset)中精选出509,323张图像,并统一缩放至384p分辨率。原始HaGRID数据集包含552,992张1080p分辨率的图像,体积高达716GB。本数据集的构建旨在为教程提供样本,使得用户能够在Google Colab和Kaggle Notebooks的免费层级中使用。
特点
该数据集涵盖了多种手部姿态,包括打电话、无手势、不喜欢、拳头、数字手势等,共计19种类别。每张图像均附有边界框(bboxes)和标签信息,其中边界框采用相对坐标表示,并提供了主导手和用户ID等信息。数据集的构建旨在简化手部姿态识别任务的数据处理流程,并便于在有限资源下进行模型训练与测试。
使用方法
用户可以通过GitHub或Kaggle平台获取该数据集。数据集的使用涉及读取图像和相应的标注信息,其中标注信息包括边界框坐标、类别标签、主导手以及用户ID。利用这些信息,研究人员可以方便地开展手部姿态识别的相关研究,包括但不限于模型训练、性能评估等。
背景与挑战
背景概述
HaGRID Sample 500k 384p数据集,源自HaGRID(HAnd Gesture Recognition Image Dataset),是由Alexander Kapitanov、Andrey Makhlyarchuk和Karina Kvanchiani等研究人员共同创建的手势识别图像数据集的子集。该数据集的创建旨在为手部手势识别研究提供便捷的资源,特别针对教学目的而制作,使得研究人员和学生在不具备高性能计算资源的情况下,也能在Google Colab和Kaggle Notebooks的免费层级中使用该数据集。包含509,323张缩放至384p分辨率的图像,覆盖了多种手部手势,为相关领域的研究提供了丰富的样本资源,自发布以来对促进手势识别技术的发展起到了积极作用。
当前挑战
尽管HaGRID Sample 500k 384p数据集为手势识别领域的研究提供了便利,但仍然面临一些挑战。首先,数据集的构建过程中涉及到大量的图像处理工作,如图像的缩放和标注,这些步骤需要消耗大量时间和计算资源。其次,数据标注的质量直接影响到后续模型的训练效果,而高质量的标注往往需要专业知识和经验。此外,尽管数据集规模较大,但可能仍然缺乏某些手势的样本,或者存在样本分布不均的问题,这可能会对模型的泛化能力造成影响。最后,由于数据集是针对特定应用场景设计的,其在其他场景下的适用性和鲁棒性有待进一步验证。
常用场景
经典使用场景
在深入探索手部和手势识别的领域,HaGRID Sample 500k 384p数据集以其规模和细致的标注成为了研究者的首选。该数据集常被用于构建和训练对象检测模型,通过对509,323张图像的分析,研究人员能够准确识别出多达19种不同的手势,从而推进了手部动作识别技术的发展。
实际应用
在实际应用层面,基于HaGRID Sample 500k 384p数据集开发的手势识别系统,可以广泛应用于虚拟现实交互、智能家居控制以及远程通讯等多个领域,提高了系统的智能化水平,增强了用户体验。
衍生相关工作
该数据集衍生了众多相关研究工作,包括但不限于手势识别算法的改进、多模态交互系统的开发以及特定手势在特定环境下的应用研究,推动了人机交互领域的技术革新和理论发展。
以上内容由遇见数据集搜集并总结生成



