five

ASL Hand Gesture Dataset|手语识别数据集|计算机视觉数据集

收藏
github2024-10-07 更新2024-10-14 收录
手语识别
计算机视觉
下载链接:
https://github.com/devAmjad4590/sign-language-detection
下载链接
链接失效反馈
资源简介:
该数据集包含美国手语(ASL)字母表中每个字母的手势图像。数据集通过使用MediaPipe的手部跟踪系统从网络摄像头捕捉手势图像创建,并经过预处理步骤(如灰度转换、高斯模糊、阈值处理和归一化)后保存。
创建时间:
2024-09-23
原始信息汇总

ASL Hand Gesture Recognition Dataset

数据集概述

该数据集用于美国手语(ASL)手势识别,包含ASL字母表中的手势图像。数据集的创建、预处理、训练和评估过程均通过脚本自动化完成。

数据集创建

  • 脚本: create_dataset.py
  • 功能: 使用摄像头捕捉ASL字母表中的手势图像。
  • 字母: A, B, C, D, E, F, G, H, I, K, L, M, N, O, P, Q, R, S, T, U, V, W, X, Y
  • 保存路径: asl_dataset/<letter>/
  • 操作: 按任意键开始捕捉图像,按q退出。

数据预处理

  • 脚本: preprocessing.py
  • 步骤:
    • 转换为灰度图像
    • 应用高斯模糊
    • 增强对比度
    • 调整图像大小为32x32像素
    • 归一化像素值
  • 输出: 预处理后的图像和标签保存为asl_dataset.npz,自动分为训练、验证和测试集。

模型训练

  • 脚本: cnn_model.py
  • 功能: 加载预处理后的数据集,构建并训练CNN模型。
  • 输出: 训练后的模型保存为asl_cnn_model.h5

手势检测

  • 脚本: sign_detector.py
  • 功能: 使用训练好的模型进行实时手势检测。
  • 操作: 打开摄像头,实时显示检测到的手势,按q退出。

模型评估

  • 脚本: evaluation.py
  • 功能: 评估模型在测试数据集上的准确性。
  • 输出: 输出准确率、精确率、召回率和F1分数。
  • 操作: 按c捕捉手势,按q退出。
AI搜集汇总
数据集介绍
main_image_url
构建方式
在构建ASL手势数据集的过程中,首先通过`create_dataset.py`脚本利用摄像头捕捉美国手语(ASL)字母表中每个字母的手势图像。该脚本利用MediaPipe的手部追踪系统,确保捕捉到的图像具有高精度的手部定位。捕捉到的图像按照字母分类存储在结构化的文件夹系统中,便于后续处理和分析。
特点
ASL手势数据集的显著特点在于其图像的高精度手部定位和结构化的存储方式。通过MediaPipe技术,数据集中的每张图像都经过精细的手部追踪处理,确保手势的准确识别。此外,数据集的结构化存储方式使得每个字母的手势图像被有序地组织,便于后续的模型训练和评估。
使用方法
使用ASL手势数据集时,首先通过`preprocessing.py`脚本对图像进行预处理,包括灰度转换、高斯模糊、阈值处理和尺寸调整,以确保图像数据的标准化和一致性。随后,通过`cnn_model.py`脚本训练卷积神经网络(CNN)模型,利用预处理后的数据进行模型训练。训练完成后,可使用`sign_detector.py`脚本进行实时手势检测,或通过`evaluation.py`脚本评估模型的性能。
背景与挑战
背景概述
ASL Hand Gesture Dataset是由Muhammad Zarif Bin Rozaini、Muhamad Syamil Imran Bin Mohd Mansor、Muhammad Amir Faris Bin Ahsan Nudin、Amgad Elrashid Gurashid Eltayeb和Balchi Maher M. N.共同创建的,旨在支持美国手语(ASL)手势识别的研究。该数据集的构建始于对ASL字母表中每个字母的手势图像的采集,通过使用MediaPipe的实时手部跟踪系统,确保了图像的高质量捕捉。这一数据集的创建不仅为手语识别领域提供了宝贵的资源,还推动了卷积神经网络(CNN)在手势识别中的应用研究,具有重要的学术和实际应用价值。
当前挑战
ASL Hand Gesture Dataset在构建过程中面临多项挑战。首先,手势图像的采集需要确保每个字母的多样性和代表性,这要求采集者在不同光照和背景条件下进行多次拍摄。其次,图像的预处理步骤复杂,包括灰度转换、高斯模糊和阈值处理,这些步骤旨在提高图像的对比度和清晰度,但也增加了处理的复杂性。此外,训练CNN模型时,如何平衡训练集、验证集和测试集的比例,以及如何优化模型的性能,也是该数据集面临的重要挑战。这些挑战不仅影响了数据集的质量,也对后续的模型训练和评估提出了高要求。
常用场景
经典使用场景
ASL Hand Gesture Dataset的经典使用场景主要集中在手语识别领域。通过该数据集,研究者和开发者能够训练卷积神经网络(CNN)模型,以识别美国手语(ASL)中的字母手势。这一过程包括图像捕捉、预处理、模型训练和实时手势检测。数据集的结构化设计使得每个字母的手势图像被系统地存储和处理,从而为深度学习模型的训练提供了高质量的输入数据。
解决学术问题
ASL Hand Gesture Dataset解决了手语识别中的关键学术问题,即如何通过计算机视觉技术准确识别和理解手语。该数据集通过提供标准化和结构化的手势图像,帮助研究者开发和验证手语识别算法,从而推动了计算机视觉和人工智能在人机交互领域的应用。其意义在于提升了手语识别系统的准确性和鲁棒性,为聋哑人士提供了更便捷的沟通工具。
衍生相关工作
ASL Hand Gesture Dataset的发布催生了一系列相关研究和工作。例如,研究者利用该数据集开发了多种手语识别模型,包括改进的CNN架构和基于注意力机制的模型,以提高识别精度和速度。此外,该数据集还被用于跨语言手语识别的研究,探索如何将ASL识别技术应用于其他手语系统。这些衍生工作不仅丰富了手语识别领域的研究内容,也推动了相关技术的实际应用。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

典型分布式光伏出力预测数据集

光伏电站出力数据每5分钟从电站机房监控系统获取;气象实测数据从气象站获取,气象站建于电站30号箱变附近,每5分钟将采集的数据通过光纤传输到机房;数值天气预报数据利用中国电科院新能源气象应用机房的WRF业务系统(包括30TF计算刀片机、250TB并行存储)进行中尺度模式计算后输出预报产品,每日8点前通过反向隔离装置推送到电站内网预测系统。

国家基础学科公共科学数据中心 收录

学生课堂行为数据集 (SCB-dataset3)

学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。

arXiv 收录

CE-CSL

CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。

arXiv 收录

风电预测数据集

全球能源预测大赛(Global Energy Forecasting Competition ) 2012 - 风力发电赛道 所用数据集.

AI_Studio 收录

VisDrone2019

VisDrone2019数据集由AISKYEYE团队在天津大学机器学习和数据挖掘实验室收集,包含288个视频片段共261,908帧和10,209张静态图像。数据集覆盖了中国14个不同城市的城市和乡村环境,包括行人、车辆、自行车等多种目标,以及稀疏和拥挤场景。数据集使用不同型号的无人机在各种天气和光照条件下收集,手动标注了超过260万个目标边界框,并提供了场景可见性、对象类别和遮挡等重要属性。

github 收录