Sign Language Digits Dataset
收藏arXiv2021-02-23 更新2024-06-21 收录
下载链接:
https://www.kaggle.com/ardamavi/sign-language-digits-dataset
下载链接
链接失效反馈官方服务:
资源简介:
Sign Language Digits Dataset是由土耳其安卡拉的Ayrancı Anadolu High School创建的一个数据集,专注于美国手语(ASL)数字的图像分类。该数据集包含3024张3024x3024像素的彩色图片,后转换为64x64像素的灰度图像,用于训练和测试卷积神经网络(CNN)。数据集的创建旨在帮助机器学习算法理解和翻译手语,特别是在提高听障人士与不懂手语人士之间的沟通效率。通过此数据集,研究者可以开发和测试用于实时手语翻译的算法,从而增强听障人士的社会参与和独立性。
Sign Language Digits Dataset was developed by Ayrancı Anadolu High School in Ankara, Turkey, and focuses on image classification tasks for American Sign Language (ASL) digits. This dataset includes 3024 color images with an original resolution of 3024×3024 pixels, which are subsequently converted into 64×64 grayscale images for training and testing Convolutional Neural Networks (CNNs). The dataset was created to assist machine learning algorithms in understanding and translating sign language, particularly to improve communication efficiency between hearing-impaired individuals and those who do not know sign language. With this dataset, researchers can develop and test real-time sign language translation algorithms, thereby enhancing the social participation and independence of hearing-impaired people.
提供机构:
Ayrancı Anadolu High School
创建时间:
2020-11-17
搜集汇总
数据集介绍

构建方式
在构建Sign Language Digits Dataset时,研究者选择了美国手语(ASL)作为数据集的基础,因其在美国及部分加拿大地区的高使用率。随后,218名志愿者被邀请使用右手进行10个不同数字的手势动作,并在白色背景下拍摄了3024x3024像素的彩色照片。这些图像随后被转换为64x64像素的灰度图像,并进行像素值的归一化处理,以确保CNN算法能够更快速地处理数据而不损失信息。
特点
Sign Language Digits Dataset的主要特点在于其高度的多样性和准确性。数据集包含了218名志愿者的手势图像,确保了数据的广泛性和代表性。此外,图像的预处理步骤,包括转换为灰度图像和像素值归一化,使得数据集在处理速度和准确性之间达到了良好的平衡。
使用方法
使用Sign Language Digits Dataset时,研究者可以将图像数据加载为Numpy数组,并利用预处理后的数据进行模型训练。数据集的标签已通过One Hot Encoding处理,便于直接应用于分类任务。研究者可以利用该数据集进行手语数字的识别研究,特别是在卷积神经网络(CNN)架构的开发和优化中。
背景与挑战
背景概述
手语数字数据集(Sign Language Digits Dataset)由Arda Mavi在土耳其安卡拉的Ayrancı Anadolu高中创建,旨在解决听障人士与不懂手语者之间的沟通障碍。该数据集于2017年发布,包含218名志愿者在白色背景下进行的美国手语(ASL)数字手势图像,共计3024张64x64像素的灰度图像。数据集的发布为机器学习算法,特别是卷积神经网络(CNN)在手语图像分类中的应用提供了丰富的数据资源,显著推动了人工智能在辅助听障人士沟通领域的研究进展。
当前挑战
尽管手语数字数据集在手语图像分类方面取得了显著成果,但仍面临若干挑战。首先,手势的角度和光照条件的变化可能导致图像分类的准确性下降,这要求数据集在多样性和代表性上进一步增强。其次,数据集的规模相对较小,限制了深度学习模型在复杂场景下的泛化能力。此外,手语的动态特性未被充分考虑,静态图像难以捕捉手势的动态变化,这为未来的研究提出了新的方向,如引入视频数据或动态捕捉技术。
常用场景
经典使用场景
在人工智能领域,Sign Language Digits Dataset 主要用于开发和验证卷积神经网络(CNN)在手语数字识别中的应用。该数据集包含了美国手语(ASL)中0到9的数字图像,通过这些图像,研究人员可以训练和测试各种CNN模型,以实现对手语数字的高精度分类。
实际应用
在实际应用中,Sign Language Digits Dataset 被广泛用于开发手语翻译系统,这些系统可以帮助听力障碍者与不懂手语的人进行有效沟通。此外,该数据集还被用于教育领域,支持手语教学和学习工具的开发,进一步提升了手语在社会中的普及和应用。
衍生相关工作
基于 Sign Language Digits Dataset,许多研究工作得以展开,包括对手语识别算法的改进、数据增强技术的应用以及实时手语翻译系统的开发。这些工作不仅提升了手语识别的准确性,还推动了相关技术在实际应用中的落地,为听力障碍人群提供了更多便利。
以上内容由遇见数据集搜集并总结生成



