five

VECSL|手语翻译数据集|数据集数据集

收藏
arXiv2025-03-09 更新2024-08-22 收录
手语翻译
数据集
下载链接:
https://github.com/Event-AHU/OpenESL
下载链接
链接失效反馈
资源简介:
VECSL数据集是由安徽大学计算机科学与技术学院创建的一个大规模的多模态手语翻译数据集,包含15676个RGB-Event样本,覆盖2588个汉字。该数据集在不同的室内外环境、多个角度、不同的光照条件和相机运动中收集样本,反映了实际场景中的关键挑战。数据集分为训练集、验证集和测试集,能够有效支持多模态手语翻译任务的研究。
提供机构:
安徽大学计算机科学与技术学院
创建时间:
2025-03-09
AI搜集汇总
数据集介绍
main_image_url
构建方式
Event-CSL数据集的构建基于高清晰度的事件流技术,通过使用Prophesee EVK4-HD事件相机,捕捉了14,827个视频样本。这些样本涵盖了多种室内外场景,包括不同的视角、光照强度和相机运动。数据集包含14,821个手语词汇和2,544个中文词汇,旨在为手语翻译研究提供一个全面且多样化的基准。
特点
Event-CSL数据集的主要特点在于其高分辨率的事件流数据,这使得它在低光照和快速运动条件下仍能保持良好的性能。此外,由于事件流的稀疏性,该数据集在保护目标人物隐私方面表现出色。数据集的多样性和广泛性使其成为手语翻译领域的一个重要资源。
使用方法
Event-CSL数据集可用于训练和评估手语翻译模型。研究者可以通过访问数据集的GitHub仓库获取数据,并使用提供的基准模型进行实验。数据集的多样性使得模型能够在不同场景下进行测试,从而提高模型的鲁棒性和泛化能力。此外,数据集还提供了详细的文档和代码示例,帮助研究者快速上手并进行相关研究。
背景与挑战
背景概述
随着深度学习的迅速发展,人工智能(AI)在辅助残障人士领域的应用日益受到关注,其中手语翻译(SLT)作为核心任务之一,旨在通过将手语视频转换为自然语言文本来促进聋哑人与非手语使用者之间的沟通。传统基于可见光视频的SLT方法易受光照、快速手部运动和隐私泄露等因素的影响。为此,Xiao Wang等研究人员于2024年提出利用高清晰度事件流进行SLT,有效缓解了上述问题。该研究团队来自安徽大学、奇渊实验室、北京理工大学、鹏城实验室和哈尔滨工业大学(深圳),他们共同创建了名为Event-CSL的高分辨率事件流手语数据集,填补了该研究领域的数据空白。该数据集包含14,827个视频、14,821个词汇和2,544个中文词汇,采集于多种室内外场景,涵盖多个角度、光照强度和摄像机运动。
当前挑战
Event-CSL数据集的构建面临多重挑战。首先,事件流数据的高动态范围和密集时间信号特性要求在低光照和运动模糊条件下仍能保持良好的性能。其次,由于事件流的稀疏空间特性,如何在保护目标人物隐私的同时,确保手语动作的完整性和准确性是一大难题。此外,数据集的多样性和复杂性增加了模型训练的难度,需要开发新的算法来有效处理这些复杂场景。最后,事件流数据的处理和分析需要高效的计算资源和优化的算法,以确保实时性和准确性。这些挑战不仅涉及技术层面的创新,还要求跨学科的合作和深入研究。
常用场景
经典使用场景
在人工智能辅助残疾领域,手语翻译(SLT)是一个核心任务。传统的SLT基于可见光视频,容易受到光照、快速手部运动和隐私泄露等因素的影响。Event-CSL数据集通过使用高清晰度的事件流进行SLT,有效缓解了上述问题。事件流具有高动态范围和密集的时间信号,能够很好地抵抗低光照和运动模糊。此外,由于其在空间上的稀疏性,有效保护了目标人物的隐私。
解决学术问题
Event-CSL数据集解决了传统SLT方法在光照变化、快速手部运动和隐私保护方面的常见问题。通过引入高清晰度事件流,该数据集为研究人员提供了一个更为鲁棒和隐私友好的SLT基准。这不仅推动了SLT技术的发展,还为相关领域的研究提供了新的方向和可能性。
衍生相关工作
基于Event-CSL数据集,许多相关工作得以展开,包括但不限于事件流处理算法、手语识别模型和跨模态数据增强技术。例如,研究人员提出了基于事件流的视觉对象跟踪方法和动态视觉传感器的人类活动识别技术。这些工作不仅丰富了事件流在计算机视觉中的应用,还为SLT领域的进一步研究提供了坚实的基础。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国农村教育发展报告

该数据集包含了中国农村教育发展的相关数据,涵盖了教育资源分布、教育质量、学生表现等多个方面的信息。

www.moe.gov.cn 收录

中国区域交通网络数据集

该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。

data.stats.gov.cn 收录

O*NET

O*NET(Occupational Information Network)是一个综合性的职业信息数据库,提供了关于各种职业的详细描述,包括技能要求、工作活动、知识领域、工作环境等。该数据集被广泛用于职业分析、教育和劳动力市场研究。

www.onetonline.org 收录

学生课堂行为数据集 (SCB-dataset3)

学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。

arXiv 收录

MedDialog

MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。

github 收录