five

CE-CSL|手语识别数据集|复杂环境数据集数据集

收藏
arXiv2024-09-18 更新2024-09-20 收录
手语识别
复杂环境数据集
下载链接:
https://github.com/woshisad159/TFNet.git
下载链接
链接失效反馈
资源简介:
CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。
提供机构:
哈尔滨工程大学智能科学与工程学院
创建时间:
2024-09-18
AI搜集汇总
数据集介绍
main_image_url
构建方式
CE-CSL数据集的构建严格遵循实际应用导向原则,从日常生活的真实场景中收集了大量连续手语视频材料。这些视频涵盖了广泛的情境变化和环境复杂性,确保了数据集的代表性和泛化能力。通过这种方式,CE-CSL数据集旨在促进手语识别技术从实验室环境向日常生活的无缝过渡,为聋人和听人社区之间的无障碍沟通奠定坚实基础。
特点
CE-CSL数据集的一个显著特点是其丰富的背景多样性,包含了超过70种不同的复杂背景,从室内到户外,从公园到街道,从商场到办公室,确保了数据集的真实性和实用性。此外,数据集还包括了12名手语表演者,其中两名是听力受损者,其余为专业手语翻译,确保了手语表达的多样性和真实性。
使用方法
CE-CSL数据集适用于连续手语识别(CSLR)研究,特别是那些需要在复杂背景条件下进行识别的场景。研究人员可以使用该数据集来训练和验证他们的模型,以提高在真实世界环境中的手语识别准确性。数据集的详细标注和多维度的理解参考,为研究人员提供了丰富的资源,有助于推动手语识别技术的发展。
背景与挑战
背景概述
手语作为一种独特的非口头语言系统,依赖于丰富的手部动作、手势形式和身体语言,是聋人社区的核心交流机制。随着计算机视觉、自然语言处理和人类计算机交互技术的发展,手语识别技术逐渐成为研究热点。为了解决现有手语数据集多局限于实验室环境或电视节目录制,背景单一、光照均匀的问题,哈尔滨工程大学智能科学与工程学院的朱启丹、李静等人于2024年构建了一个基于复杂环境的中国连续手语数据集(CE-CSL)。该数据集包含5988个连续手语视频片段,涵盖超过70种不同的复杂背景,旨在提高手语识别技术在真实场景中的代表性和泛化能力。
当前挑战
CE-CSL数据集的构建面临多重挑战。首先,现有手语数据集的环境单一性导致模型在真实场景中的识别性能下降。其次,数据集的构建过程中需要克服复杂背景和自然光照条件对识别精度的影响。此外,手语作为一种视觉语言,其独特的语法结构和词汇顺序与传统书面或口头语言有显著差异,增加了数据标注的复杂性。为了应对这些挑战,研究团队提出了时间-频率网络(TFNet)模型,通过提取帧级特征并利用时间与频域信息进行序列特征融合,以实现高效准确的手语识别。
常用场景
经典使用场景
CE-CSL数据集的经典使用场景主要集中在连续手语识别(CSLR)领域。由于该数据集包含了从日常生活场景中收集的5,988个连续手语视频片段,涵盖了超过70种不同的复杂背景,因此它特别适用于研究在复杂环境中进行高效和准确的手语识别。通过使用CE-CSL数据集,研究人员可以开发和验证新的算法,以应对现实世界中手语识别的挑战,如背景多样性和光照变化。
实际应用
CE-CSL数据集在实际应用中具有广泛的前景,特别是在教育和公共服务领域。例如,在教育环境中,教师可以使用基于CE-CSL训练的识别系统来理解和回应聋哑学生的手语表达,从而提高教学效果。在公共服务中,如警察局、医院和市民服务中心,工作人员可以通过该系统与聋哑人士进行有效沟通,提升服务质量和效率。此外,CE-CSL还可以用于开发智能家居设备,使聋哑人士能够通过手语控制家庭设备,提高生活质量。
衍生相关工作
CE-CSL数据集的发布激发了大量相关研究工作。例如,基于该数据集,研究人员提出了时间-频率网络(TFNet)模型,该模型通过提取帧级特征并利用时间和频域信息进行序列特征融合,显著提高了手语识别的准确性。此外,CE-CSL还促进了对手语识别中复杂背景处理的研究,推动了多模态数据融合和深度学习技术在手语识别中的应用。这些研究不仅提升了手语识别的性能,还为其他复杂环境下的视觉识别任务提供了新的思路和方法。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

China Health and Nutrition Survey (CHNS)

China Health and Nutrition Survey(CHNS)是一项由美国北卡罗来纳大学人口中心与中国疾病预防控制中心营养与健康所合作开展的长期开放性队列研究项目,旨在评估国家和地方政府的健康、营养与家庭计划政策对人群健康和营养状况的影响,以及社会经济转型对居民健康行为和健康结果的作用。该调查覆盖中国15个省份和直辖市的约7200户家庭、超过30000名个体,采用多阶段随机抽样方法,收集了家庭、个体以及社区层面的详细数据,包括饮食、健康、经济和社会因素等信息。自2011年起,CHNS不断扩展,新增多个城市和省份,并持续完善纵向数据链接,为研究中国社会经济变化与健康营养的动态关系提供了重要的数据支持。

www.cpc.unc.edu 收录

波士顿房价数据集

波士顿房价数据集是一个经典的机器学习数据集,通常用于回归任务,尤其是房价预测。下方文档中有所有字段顺序的描述。

阿里云天池 收录

UIEB, U45, LSUI

本仓库提供了水下图像增强方法和数据集的实现,包括UIEB、U45和LSUI等数据集,用于支持水下图像增强的研究和开发。

github 收录

NASA Battery Dataset

用于预测电池健康状态的数据集,由NASA提供。

github 收录

LMHLD (Large-scale Multi-source High-resolution Landslide Dataset)

LMHLD是一个大规模多源高分辨率滑坡数据集,由中国地质大学(武汉)未来技术学院构建。该数据集收集了全球七个研究区域的遥感图像,包括中国汶川、巴西里约热内卢、尼泊尔戈尔卡、中国九寨沟、中国台湾、日本北海道和意大利艾米利亚-罗马涅,涵盖了不同触发条件下的多种类型滑坡。数据集包含25365个不同大小的斑块,以适应不同尺度的滑坡检测需求,为基于深度学习的滑坡检测提供了丰富的训练样本。

arXiv 收录