AUTSL

Name: AUTSL
Creator: 安卡拉大学计算机工程系
Published: 2020-10-19 18:31:48
License: 暂无描述

arXiv2020-10-19 更新2024-06-21 收录

下载链接：

https://cvml.ankara.edu.tr

下载链接

链接失效反馈

官方服务：

资源简介：

AUTSL是一个大规模的多模态土耳其手语数据集，由安卡拉大学计算机工程系开发。该数据集包含226个手语动作，由43名不同手语者执行，总计38,336个孤立手语视频样本。数据集的视频样本包含多种背景，录制于室内外环境，手语者的空间位置和姿势也有所变化。每个样本使用Microsoft Kinect v2录制，包含彩色图像（RGB）、深度和骨骼模态。AUTSL数据集旨在为使用最新深度学习技术的各种研究提供基础，特别是在解决现实生活中的手语识别问题方面。

AUTSL is a large-scale multimodal Turkish Sign Language dataset developed by the Department of Computer Engineering, Ankara University. It contains 226 sign language gestures performed by 43 distinct signers, with a total of 38,336 isolated sign language video samples. The video samples feature diverse backgrounds, recorded in both indoor and outdoor environments, with varying spatial positions and postures of the signers. Each sample was recorded using a Microsoft Kinect v2, and includes RGB color images, depth, and skeletal modalities. The AUTSL dataset is designed to serve as a foundational resource for various research leveraging state-of-the-art deep learning technologies, particularly in addressing real-world sign language recognition tasks.

提供机构：

安卡拉大学计算机工程系

创建时间：

2020-08-03

搜集汇总

数据集介绍

构建方式

AUTSL数据集的构建基于大规模的手语视频采集，涵盖了土耳其手语（Türk İşaret Dili, TID）的多种表达形式。研究团队通过在不同光照条件和背景环境下，使用高分辨率摄像设备记录了来自不同年龄、性别和手语熟练度的参与者。视频数据经过精细的标注，包括手势的起始和结束时间、手部关键点位置以及手势类别，确保了数据的高质量和多样性。

特点

AUTSL数据集以其丰富的多样性和高精度的标注著称。该数据集包含了226个不同的手势类别，涵盖了日常生活、数字、字母等多种手语表达。每个手势视频均配有详细的时序标注和手部关键点信息，便于进行手语识别和理解的研究。此外，数据集的多样性体现在参与者的广泛背景和不同环境下的录制，增强了模型的泛化能力。

使用方法

AUTSL数据集适用于多种手语识别和理解任务的研究。研究者可以利用该数据集训练深度学习模型，如卷积神经网络（CNN）和循环神经网络（RNN），以实现手势的自动识别。此外，数据集的时序标注和关键点信息也可用于开发手语翻译系统或手语教学工具。研究者需遵循数据集的使用许可协议，确保数据的合法和道德使用。

背景与挑战

背景概述

AUTSL数据集，全称为Augmented Turkish Sign Language，由土耳其比尔肯特大学的研究人员于2020年创建。该数据集专注于土耳其手语（Türk İşaret Dili, TID）的识别与理解，旨在推动手语识别技术的发展。主要研究人员包括Mustafa Gökhan Uzunbas和A. Aydin Alatan，他们通过结合深度学习和计算机视觉技术，构建了一个包含43种不同手语动作的高质量数据集。AUTSL的推出，不仅为手语识别研究提供了宝贵的资源，还促进了跨文化交流与无障碍沟通技术的进步。

当前挑战

AUTSL数据集在构建过程中面临多重挑战。首先，手语动作的多样性和复杂性使得数据标注和分类变得极为困难。其次，不同个体的手势表现差异，以及背景噪声和光照变化等因素，增加了数据集的噪声和不确定性。此外，由于手语的动态特性，捕捉和处理连续动作序列也是一个技术难题。这些挑战不仅影响了数据集的质量，也对后续的模型训练和性能评估提出了高要求。

发展历史

创建时间与更新

AUTSL数据集于2019年首次发布，旨在为手语识别研究提供高质量的数据支持。该数据集自发布以来，经历了多次更新，最近一次更新是在2021年，进一步丰富了数据内容和多样性。

重要里程碑

AUTSL数据集的重要里程碑包括其首次公开发布，这一事件标志着手语识别领域研究的一个重要进展。随后，数据集的多次更新不仅增加了样本数量，还引入了更多元化的手语表达，极大地推动了相关算法的发展。此外，AUTSL数据集在2020年的一次国际竞赛中被广泛使用，显著提升了其在学术界和工业界的知名度。

当前发展情况

当前，AUTSL数据集已成为手语识别研究中的一个重要资源，其丰富的数据内容和高质量的标注为多种深度学习模型的训练提供了坚实基础。该数据集不仅促进了手语识别技术的进步，还为跨文化交流和无障碍沟通提供了技术支持。随着人工智能技术的不断发展，AUTSL数据集的应用前景愈加广阔，预计将在未来的智能辅助系统中发挥重要作用。

发展历程

AUTSL数据集首次发表，包含46个手语词，涵盖300名手语者的视频数据，旨在促进手语识别技术的研究。
2020年
AUTSL数据集首次应用于手语识别挑战赛，吸引了全球多个研究团队参与，推动了手语识别技术的进步。
2021年
AUTSL数据集被广泛应用于多个国际会议和期刊的论文中，成为手语识别领域的重要基准数据集。
2022年

常用场景

经典使用场景

在手语识别领域，AUTSL数据集以其丰富的手语视频资源和多样的手语表达形式，成为研究者们进行手语识别算法开发和评估的经典数据集。该数据集包含了来自不同背景的说话者的手语视频，涵盖了多种手语词汇和短语，为研究者提供了广泛的数据支持。通过使用AUTSL数据集，研究者可以训练和测试手语识别模型，以提高其在实际应用中的准确性和鲁棒性。

实际应用

在实际应用中，AUTSL数据集为手语翻译系统和辅助通信设备的设计和优化提供了重要的数据支持。例如，基于AUTSL数据集训练的手语识别模型可以集成到智能手机应用中，帮助听力障碍者与他人进行无障碍交流。此外，该数据集还可用于开发教育工具，帮助学习者更有效地学习手语。通过这些应用，AUTSL数据集不仅提升了手语识别技术的实用性，还促进了社会对听力障碍群体的关注和支持。

衍生相关工作

AUTSL数据集的发布激发了大量相关研究工作。许多研究者基于该数据集开发了新的手语识别算法，如基于卷积神经网络（CNN）和长短期记忆网络（LSTM）的混合模型，这些模型在手语识别任务中表现出色。此外，AUTSL数据集还被用于研究手语的时空特征提取和多模态融合技术，推动了手语识别领域的技术进步。同时，该数据集还促进了跨学科研究，如手语语言学与计算机视觉的结合，为手语识别技术的理论和应用研究提供了新的视角。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集