One-Stage-TFS

Name: One-Stage-TFS
Creator: 马哈沙拉堪大学
Published: 2024-11-05 11:26:26
License: 暂无描述

arXiv2024-11-05 更新2024-11-07 收录

下载链接：

https://data.mendeley.com/datasets/rknd3wbz42/1

下载链接

链接失效反馈

官方服务：

资源简介：

One-Stage-TFS数据集是由马哈沙拉堪大学创建，专注于泰国手语中单阶段辅音手势识别的综合资源。该数据集包含7200张图像，捕捉了15种单阶段辅音手势，由拉贾巴特马哈沙拉堪大学的学生在2021年7月至12月期间使用DSLR相机拍摄。数据集的创建过程包括专家学生和无经验学生的手势示范与模仿，背景包括简单和复杂两种。该数据集旨在支持计算机科学领域的研究，特别是深度学习、计算机视觉和模式识别，以开发新的端到端手势识别框架，解决泰国手语识别的挑战。

The One-Stage-TFS Dataset was developed by Maha Sarakham University as a comprehensive resource focused on single-stage consonant gesture recognition in Thai Sign Language (TSL). This dataset contains 7200 images capturing 15 categories of single-stage consonant gestures, which were collected by students from Rajamangala University of Technology Maha Sarakham between July and December 2021 using DSLR cameras. The construction of this dataset involved gesture demonstration and imitation by both expert and inexperienced students, with two types of backgrounds: simple and complex. This dataset aims to support research in computer science, especially deep learning, computer vision and pattern recognition, for developing new end-to-end gesture recognition frameworks to tackle the challenges in Thai Sign Language recognition.

提供机构：

马哈沙拉堪大学

创建时间：

2024-11-05

搜集汇总

数据集介绍

构建方式

One-Stage-TFS数据集的构建始于2021年7月至12月，由泰国Rajabhat Maha Sarakham大学的学生参与。该数据集专注于泰国手语中的一阶段辅音手势，共包含7,200张图像，涵盖15种手势。数据采集过程中，使用了DSLR相机，记录了来自特殊教育部门有经验的学生以及其他无经验学生的手势。图像背景包括简单和复杂两种，以增加数据集的多样性和挑战性。

特点

One-Stage-TFS数据集的显著特点在于其专注于泰国手语的一阶段辅音手势，提供了丰富的手势多样性。数据集中的图像分辨率为1280x720像素，且未指定手势是左手还是右手，增加了识别的复杂性。此外，数据集包含简单和复杂背景的图像，为研究者提供了在不同环境下进行手势检测和识别的机会。

使用方法

研究者可以通过Mendeley Data平台访问One-Stage-TFS数据集，该数据集支持多种计算机科学领域的应用，包括深度学习、计算机视觉和模式识别。使用者可以利用YOLO、EfficientDet、RetinaNet和Detectron等深度学习方法进行手部检测，随后使用卷积神经网络、变换器和自适应特征融合网络等技术进行特征提取和手势识别。数据集的XML文件提供了手部位置和手势标签，便于进行模型训练和评估。

背景与挑战

背景概述

在手势识别领域，特别是泰国手语的识别研究中，One-Stage-TFS数据集的创建标志着一项重要的进展。该数据集由泰国玛哈沙拉堪大学的Siriwiwat Lata、Sirawan Phiphitphatphaisit、Emmanuel Okafor和Olarik Surinta等研究人员于2021年7月至12月期间收集，专注于泰国手语中的一阶段辅音手势识别。数据集包含了7,200张图像，涵盖了15种一阶段辅音手势，由来自特殊教育系的学生和无手语经验的学生共同参与采集。这一数据集的创建不仅为手势识别研究提供了丰富的资源，还推动了深度学习和计算机视觉技术在该领域的应用。

当前挑战

One-Stage-TFS数据集在手势识别领域面临多项挑战。首先，数据集中手势图像的背景复杂多样，从简单的纯色背景到复杂的自然场景，这增加了手部检测和识别的难度。其次，数据集未明确区分左右手，这为手势分类带来了额外的复杂性。此外，数据集的构建过程中，研究人员需要确保图像质量和手势的标准化，以提高模型的泛化能力。这些挑战为研究人员提供了开发新型端到端识别框架的机会，特别是在手部检测和特征提取方面，需要探索如YOLO、EfficientDet等深度学习方法的应用。

常用场景

经典使用场景

One-Stage-TFS数据集的经典使用场景主要集中在手势识别和手指拼写识别领域。该数据集通过提供7,200张包含15种泰国单阶段辅音手势的图像，为研究人员提供了丰富的资源，以开发和验证基于深度学习的手势识别框架。这些图像涵盖了从简单到复杂的背景，挑战了手部检测和识别的准确性，为研究者提供了探索如YOLO、EfficientDet、RetinaNet和Detectron等先进检测算法的机会。

实际应用

One-Stage-TFS数据集在实际应用中具有广泛的前景，特别是在辅助听障人士沟通的设备和技术开发中。通过利用该数据集训练的模型，可以开发出能够实时识别和翻译泰国手语的手势识别系统，从而提高听障人士的沟通效率和生活质量。此外，该数据集还可应用于教育、人机交互和虚拟现实等领域，推动相关技术的创新和应用。

衍生相关工作

One-Stage-TFS数据集的发布激发了大量相关研究工作。例如，Lata和Surinta在2022年提出了一种端到端的泰国手指拼写识别框架，利用YOLOv3算法实现了高效的手部检测。此外，该数据集还促进了对手势识别算法的改进，如EfficientDet和RetinaNet的应用研究，以及特征提取和融合网络的创新，如卷积神经网络、变换器和自适应特征融合网络的发展。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集