Sign Language Digits Dataset
收藏arXiv2021-02-23 更新2024-06-21 收录
下载链接:
https://www.kaggle.com/ardamavi/sign-language-digits-dataset
下载链接
链接失效反馈资源简介:
Sign Language Digits Dataset是由土耳其安卡拉的Ayrancı Anadolu High School创建的一个数据集,专注于美国手语(ASL)数字的图像分类。该数据集包含3024张3024x3024像素的彩色图片,后转换为64x64像素的灰度图像,用于训练和测试卷积神经网络(CNN)。数据集的创建旨在帮助机器学习算法理解和翻译手语,特别是在提高听障人士与不懂手语人士之间的沟通效率。通过此数据集,研究者可以开发和测试用于实时手语翻译的算法,从而增强听障人士的社会参与和独立性。
提供机构:
Ayrancı Anadolu High School
创建时间:
2020-11-17
AI搜集汇总
数据集介绍

构建方式
在构建Sign Language Digits Dataset时,研究者选择了美国手语(ASL)作为数据集的基础,因其在美国及部分加拿大地区的高使用率。随后,218名志愿者被邀请使用右手进行10个不同数字的手势动作,并在白色背景下拍摄了3024x3024像素的彩色照片。这些图像随后被转换为64x64像素的灰度图像,并进行像素值的归一化处理,以确保CNN算法能够更快速地处理数据而不损失信息。
特点
Sign Language Digits Dataset的主要特点在于其高度的多样性和准确性。数据集包含了218名志愿者的手势图像,确保了数据的广泛性和代表性。此外,图像的预处理步骤,包括转换为灰度图像和像素值归一化,使得数据集在处理速度和准确性之间达到了良好的平衡。
使用方法
使用Sign Language Digits Dataset时,研究者可以将图像数据加载为Numpy数组,并利用预处理后的数据进行模型训练。数据集的标签已通过One Hot Encoding处理,便于直接应用于分类任务。研究者可以利用该数据集进行手语数字的识别研究,特别是在卷积神经网络(CNN)架构的开发和优化中。
背景与挑战
背景概述
手语数字数据集(Sign Language Digits Dataset)由Arda Mavi在土耳其安卡拉的Ayrancı Anadolu高中创建,旨在解决听障人士与不懂手语者之间的沟通障碍。该数据集于2017年发布,包含218名志愿者在白色背景下进行的美国手语(ASL)数字手势图像,共计3024张64x64像素的灰度图像。数据集的发布为机器学习算法,特别是卷积神经网络(CNN)在手语图像分类中的应用提供了丰富的数据资源,显著推动了人工智能在辅助听障人士沟通领域的研究进展。
当前挑战
尽管手语数字数据集在手语图像分类方面取得了显著成果,但仍面临若干挑战。首先,手势的角度和光照条件的变化可能导致图像分类的准确性下降,这要求数据集在多样性和代表性上进一步增强。其次,数据集的规模相对较小,限制了深度学习模型在复杂场景下的泛化能力。此外,手语的动态特性未被充分考虑,静态图像难以捕捉手势的动态变化,这为未来的研究提出了新的方向,如引入视频数据或动态捕捉技术。
常用场景
经典使用场景
在人工智能领域,Sign Language Digits Dataset 主要用于开发和验证卷积神经网络(CNN)在手语数字识别中的应用。该数据集包含了美国手语(ASL)中0到9的数字图像,通过这些图像,研究人员可以训练和测试各种CNN模型,以实现对手语数字的高精度分类。
实际应用
在实际应用中,Sign Language Digits Dataset 被广泛用于开发手语翻译系统,这些系统可以帮助听力障碍者与不懂手语的人进行有效沟通。此外,该数据集还被用于教育领域,支持手语教学和学习工具的开发,进一步提升了手语在社会中的普及和应用。
衍生相关工作
基于 Sign Language Digits Dataset,许多研究工作得以展开,包括对手语识别算法的改进、数据增强技术的应用以及实时手语翻译系统的开发。这些工作不仅提升了手语识别的准确性,还推动了相关技术在实际应用中的落地,为听力障碍人群提供了更多便利。
以上内容由AI搜集并总结生成



