Hagrid 150k

github2024-11-17 更新2024-11-22 收录

下载链接：

https://github.com/Abhik555/Hand-Gesture-Recognition-System-And-Survey-Application

下载链接

链接失效反馈

官方服务：

资源简介：

Hagrid 150k数据集是一个全面的手势图像集合，包含在不同光照条件和背景下捕捉的各种手势。

The Hagrid 150k Dataset is a comprehensive collection of gesture images, featuring various gestures captured under varying lighting conditions and diverse backgrounds.

创建时间：

2024-11-17

原始信息汇总

Hand Gesture Recognition System and Survey Application

Dataset

Hagrid 150k Dataset

Description: A comprehensive collection of hand gesture images.
Features: Includes various gestures captured under different lighting conditions and backgrounds.
Link: Dataset

Preprocessing

Resize Image: Change image size to 256x256.
Random Rotation: Randomly rotate images.
Random Zoom: Randomly zoom into images.
Random Flipping: Randomly flip images horizontally.
Image Rescaling: Rescale pixel values to the range [0, 1].

Model Architecture

Simple CNN

Layers:
- Conv2D: 16 filters, activation relu, input shape (256, 256, 3)
- MaxPooling2D: pool size 2x2
- Conv2D: 32 filters, activation relu
- MaxPooling2D: pool size 2x2
- Conv2D: 64 filters, activation relu
- MaxPooling2D: pool size 2x2
- Dropout
- Flatten
- Dense: 128 units, activation relu
- Dense: 10 units, activation softmax

Complex CNN

Layers:
- Conv2D(32, (3, 3), activation=relu, padding=same)
- BatchNormalization()
- MaxPooling2D((2, 2))
- Dropout(0.25)
- Conv2D(64, (3, 3), activation=relu, padding=same)
- BatchNormalization()
- MaxPooling2D((2, 2))
- Dropout(0.25)
- Conv2D(128, (3, 3), activation=relu, padding=same)
- BatchNormalization()
- MaxPooling2D((2, 2))
- Dropout(0.25)
- Flatten()
- Dense(256, activation=relu)
- BatchNormalization()
- Dropout(0.5)
- Dense(num_classes, activation=softmax, name="outputs")

Model Training

Optimizer: Adam
Loss Function: SparseCategoricalCrossentropy
Epochs: 15
Batch Size: 128

Evaluation

Metrics: Accuracy, Precision, Recall, F1-score

Results

Simple CNN Metrics

Accuracy: 82%
Precision: 80%
Recall: 79%
F1-score: 80%
Model Size:
- keras file: 96.4 MB
- tflite: 32.1 MB

Complex CNN Metrics

Accuracy: 74%
Precision: 72%
Recall: 71%
F1-score: 71%
Model Size:
- keras file: 385 MB
- tflite: 128 MB

Compareable ResNET50 Model

Accuracy: 93%
Precision: 93%
Recall: 92%
F1-score: 92%
Model Size:
- keras file: 271 MB
- tflite: 89.8 MB

Conclusion

Summary: The hand gesture detection model demonstrates varying results from multiple model architectures.

Future Work

Improvements:
- Expand the dataset with more diverse gestures.
- Implement mobile app-based surveys for user feedback.
- Enhance model architectures for better performance.
- Add ability to test user-made models on the mobile app.
- User customizable surveys.

搜集汇总

数据集介绍

构建方式

Hagrid 150k数据集的构建基于对多种手势图像的全面收集与处理。该数据集包含150,000张手势图像，涵盖了不同光照条件和背景下的多种手势。图像预处理步骤包括调整图像大小至256x256像素、随机旋转、随机缩放、水平翻转以及像素值归一化至[0, 1]范围，以增强模型的鲁棒性和泛化能力。

特点

Hagrid 150k数据集的显著特点在于其大规模和多样性。数据集不仅包含丰富的手势类别，还考虑了不同环境条件下的图像采集，确保了数据的真实性和实用性。此外，通过多种预处理技术，数据集能够有效支持深度学习模型的训练，提升模型在实际应用中的表现。

使用方法

使用Hagrid 150k数据集进行模型训练时，用户需首先安装必要的依赖库，如TensorFlow和Kaggle。随后，通过运行提供的Jupyter Notebook文件，用户可以执行数据加载、预处理、模型构建及训练等步骤。此外，数据集还支持移动应用的本地构建，用户可通过Flutter框架进行应用开发，实现手势识别模型的实时测试与反馈收集。

背景与挑战

背景概述

手势识别作为人机交互的关键组成部分，近年来在计算机视觉领域引起了广泛关注。Hagrid 150k数据集由主要研究人员或机构创建，旨在通过大规模的手势图像集合，推动手势识别技术的发展。该数据集包含多种手势图像，涵盖不同光照条件和背景，为深度学习模型，特别是卷积神经网络（CNN），提供了丰富的训练资源。其核心研究问题在于如何通过自定义CNN架构与标准模型进行比较，以找到复杂性与准确性之间的最佳平衡点。Hagrid 150k数据集的推出，不仅为手势识别研究提供了新的基准，还对自动驾驶、医疗保健和安全系统等应用领域产生了深远影响。

当前挑战

Hagrid 150k数据集在构建过程中面临多项挑战。首先，数据集的多样性要求模型具备高度的鲁棒性，以应对不同光照和背景条件下的手势识别。其次，数据增强技术的应用，如随机旋转、缩放和翻转，虽然增加了数据的丰富性，但也增加了模型训练的复杂性。此外，模型评估过程中，如何平衡模型的复杂度与准确性，特别是在移动应用场景中，是一个重要的挑战。最后，数据集的扩展和用户反馈机制的建立，以持续优化模型性能，也是未来研究的重要方向。

常用场景

经典使用场景

在计算机视觉领域，Hagrid 150k数据集的经典使用场景主要集中在手势识别系统的开发与优化。该数据集通过提供多样化的手势图像，支持研究人员训练和验证卷积神经网络（CNN）模型，以实现对手势的精确分类。这种应用不仅在学术研究中具有重要意义，还在实际应用中如智能家居、虚拟现实和医疗辅助系统中展现出巨大潜力。

解决学术问题

Hagrid 150k数据集解决了手势识别领域中常见的学术研究问题，如手势图像的多样性不足、光照条件和背景变化对识别精度的影响等。通过提供大量多样化的手势图像，该数据集帮助研究人员开发出更具鲁棒性和准确性的手势识别模型，推动了计算机视觉和人工智能领域的发展。

衍生相关工作

基于Hagrid 150k数据集，许多相关研究工作得以展开，包括对手势识别模型的优化、多模态数据融合以及实时手势识别系统的开发。例如，有研究通过结合深度学习和传统图像处理技术，提高了手势识别的准确性和实时性。此外，该数据集还促进了移动端手势识别应用的开发，推动了人机交互技术的进步。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集