Kenyan Sign Language (KSL) Dataset
收藏arXiv2024-10-24 更新2024-10-29 收录
下载链接:
http://arxiv.org/abs/2410.18295v1
下载链接
链接失效反馈官方服务:
资源简介:
Kenyan Sign Language (KSL) Dataset是由马塞诺大学创建的一个用于辅助技术开发的数据集,旨在消除肯尼亚聋哑学习者与听觉正常者之间的沟通障碍。该数据集包含约14,000条英语句子及其对应的KSL Gloss,以及约20,000个KSL视频,涵盖单词和句子。数据集的创建过程涉及从48名教师和400名聋哑学习者中收集数据,通过阅读和唱歌等任务进行手语诱导。该数据集主要应用于聋哑社区,旨在通过AI技术促进教育和其他领域的包容性,解决聋哑学习者在语言获取和教育适应方面的挑战。
Kenyan Sign Language (KSL) Dataset was developed by Maseno University for assistive technology development, aiming to eliminate communication barriers between Kenyan deaf learners and hearing individuals. This dataset contains approximately 14,000 English sentences and their corresponding KSL glosses, as well as roughly 20,000 KSL videos covering both individual words and complete sentences. The dataset's creation involved collecting data from 48 teachers and 400 deaf learners, with sign language elicitation conducted via tasks such as reading and singing. Primarily targeted at the deaf community, this dataset seeks to promote inclusivity in education and other fields through AI technologies, and address the challenges faced by deaf learners in language acquisition and educational adaptation.
提供机构:
马塞诺大学
创建时间:
2024-10-24
搜集汇总
数据集介绍

构建方式
肯尼亚手语(KSL)数据集的构建基于一个为期两年的研究项目(2023-2024),旨在通过人工智能(AI)技术消除聋人学习者与听人之间的沟通障碍。数据集的构建过程包括从48名聋人教师和400名聋人学习者中收集数据,参与者主要通过阅读和唱歌进行手语诱发任务。研究团队收集了约14,000个英语句子及其对应的KSL Gloss,以及约20,000个手语视频,这些视频涵盖了单词和句子。此外,数据集还包括10,000个分割和分段的KSL视频,以及4,000个根据HamNoSys系统转录的单词。
使用方法
肯尼亚手语(KSL)数据集主要用于开发和测试将英语翻译为肯尼亚手语的辅助人工智能技术。研究者可以利用该数据集训练机器学习模型,以实现从英语文本或语音到手语的自动转换。具体使用方法包括:首先,利用数据集中的英语句子和对应的KSL Gloss进行翻译模型的训练;其次,使用分割和分段的手语视频数据进行手语识别和生成模型的开发;最后,结合HamNoSys转录数据,实现手语的精确表示和动画渲染。
背景与挑战
背景概述
肯尼亚手语(Kenyan Sign Language, KSL)数据集是由Wanzare L、Okutoyi J、Kang’ahi M和Ayere M等研究人员在Maseno大学开发的,旨在通过人工智能技术消除聋哑学习者与听觉正常者之间的沟通障碍。该项目始于2023年,预计于2024年完成,旨在创建一个数字化的开放访问AI系统,用于处理来自肯尼亚聋哑社区的代表性样本的自发和引发数据。该数据集的核心研究问题是如何利用AI辅助技术将英语翻译成KSL,以促进肯尼亚聋哑学习者的包容性和语言障碍的消除。该数据集的构建对聋哑社区具有重要意义,有助于打破沟通障碍,促进聋哑人在教育和其它领域的更广泛参与。
当前挑战
KSL数据集在构建过程中面临多项挑战。首先,数据收集涉及从48名聋哑学习者的教师和400名聋哑学习者中获取视频记录,这需要确保数据的多样性和代表性。其次,视频数据的预处理和分割是一项复杂任务,需确保每个视频片段仅包含单一的手语词汇或句子。此外,将手语视频转换为HamNoSys符号系统的转录过程也极具挑战性,需要精确捕捉手语的五个发音参数。最后,尽管已有一些AI系统用于手语翻译,但将语音转换为肯尼亚手语的研究仍处于起步阶段,缺乏大规模数据集和成熟的技术解决方案。
常用场景
经典使用场景
肯尼亚手语(KSL)数据集的经典使用场景主要集中在人工智能辅助技术领域,旨在通过将英语口语或书面语实时转换为肯尼亚手语,以消除聋哑学习者与听力正常者之间的沟通障碍。该数据集通过收集和标注大量的英语句子及其对应的肯尼亚手语视频,为开发能够进行实时翻译的AI系统提供了基础。这种技术不仅在教育环境中具有重要意义,还能广泛应用于社交互动、表达需求和日常沟通等场景,极大地促进了聋哑社区的社会融入和文化交流。
解决学术问题
肯尼亚手语(KSL)数据集解决了聋哑学习者在语言获取和教育适应方面的常见学术问题。由于聋哑儿童通常出生在听力正常的家庭,缺乏手语环境,导致语言发展滞后,进而影响其学术成就和社会融入。该数据集通过提供丰富的手语视频和对应的英语文本,为研究者开发有效的语言获取策略和教育工具提供了宝贵的资源。这不仅有助于提升聋哑学习者的语言能力和学术表现,还为全球聋哑教育领域的研究提供了新的视角和方法。
实际应用
肯尼亚手语(KSL)数据集的实际应用场景广泛,涵盖教育、社交和公共服务等多个领域。在教育方面,该数据集支持开发实时翻译工具,帮助聋哑学生在课堂中更好地理解教学内容,提升学习效果。在社交互动中,这些工具能够促进聋哑个体与听力正常者之间的有效沟通,增强社会包容性。此外,公共服务机构如医院和法院也可以利用这些技术,提供无障碍的沟通环境,确保聋哑群体的权益得到充分保障。
数据集最近研究
最新研究方向
在肯尼亚手语(KSL)数据集的最新研究中,人工智能(AI)技术被广泛应用于消除聋哑学习者与听觉正常者之间的沟通障碍。该研究项目(2023-2024)旨在创建一个数字开放访问的AI系统,通过从肯尼亚聋哑社区的代表性样本中收集自发和诱导数据,实现英语到肯尼亚手语的翻译。这一研究不仅促进了聋哑学习者在教育中的包容性,还通过构建KSL数据集和开发音素级接口的转录技术,推动了手语研究的前沿。此外,该研究还探索了AI技术在非洲背景下应用于听觉障碍教育的潜力,为全球聋哑教育提供了新的解决方案。
相关研究论文
- 1Kenyan Sign Language (KSL) Dataset: Using Artificial Intelligence (AI) in Bridging Communication Barrier among the Deaf Learners马塞诺大学 · 2024年
以上内容由遇见数据集搜集并总结生成



