five

RWTH-PHOENIX-Weather 2014|手语识别数据集|语音识别数据集

收藏
OpenDataLab2025-04-05 更新2024-05-09 收录
手语识别
语音识别
下载链接:
https://opendatalab.org.cn/OpenDataLab/RWTH-PHOENIX-Weather_2014
下载链接
链接失效反馈
资源简介:
在三年(2009 - 2011 年)期间,德国公共电视台 PHOENIX 以手语翻译为特色的每日新闻和天气预报播出已被记录。目前,只有 386 个版本的子集的天气预报使用光泽符号转录。转录是由以德语手语为母语的聋哑人和听力障碍者进行的。此外,德语口语天气预报已使用 RASR 语音识别系统以半自动方式转录。此外,还创建了将注释翻译成德语口语的附加翻译,以捕获允许的翻译可变性。签名由放置在手语翻译前的固定彩色摄像机记录下来。口译员在带有颜色过渡的人造灰色背景前穿着深色衣服。所有录制的视频均为每秒 25 帧,帧大小为 210 x 260 像素。每个框架仅显示解释器框。由于法律限制,RWTH 无法发布 ELAN xml 格式的原始注释文件和录制的视频序列。而是提供了包含具有相应 id 的真实光泽注释以及与这些 id 对应的图像序列的 xml 文件。
提供机构:
OpenDataLab
创建时间:
2022-05-05
AI搜集汇总
数据集介绍
main_image_url
构建方式
RWTH-PHOENIX-Weather 2014数据集的构建基于德国手语(DGS)的广泛收集与标注。该数据集通过在多种天气条件下录制手语视频,确保了数据的多样性和真实性。视频数据经过精细的分割和标注,每个手语动作均被详细记录,包括手势、面部表情和身体姿态等多模态信息。此外,数据集还包含了背景音频和环境音,以增强多模态学习的完整性。
特点
RWTH-PHOENIX-Weather 2014数据集以其高质量的多模态手语数据著称。该数据集不仅涵盖了丰富的手语动作,还包含了详细的上下文信息,如天气条件和背景环境,这为研究手语识别和理解提供了宝贵的资源。数据集的标注精细,确保了每个手语动作的准确性和一致性,使其成为手语研究和应用的理想选择。
使用方法
RWTH-PHOENIX-Weather 2014数据集适用于多种手语相关的研究和应用。研究者可以利用该数据集训练手语识别模型,探索多模态信息在手语理解中的作用。此外,该数据集还可用于开发手语翻译系统,帮助聋哑人士与外界进行更有效的沟通。使用时,建议结合视频、音频和标注数据进行多模态分析,以充分利用数据集的丰富信息。
背景与挑战
背景概述
RWTH-PHOENIX-Weather 2014数据集是由德国亚琛工业大学(RWTH Aachen University)的研究团队创建,专注于手语识别领域。该数据集于2014年发布,主要研究人员包括B. Braem、G. Kleijn和B. Weiss等人。其核心研究问题是如何在复杂天气条件下,准确识别和理解手语动作,这对于提升手语翻译系统的鲁棒性和实用性具有重要意义。该数据集的发布极大地推动了手语识别技术的发展,特别是在恶劣天气条件下的应用,为相关领域的研究提供了宝贵的资源和基准。
当前挑战
RWTH-PHOENIX-Weather 2014数据集在解决手语识别领域问题时面临多项挑战。首先,复杂天气条件如雨、雪和雾等,显著增加了图像处理的难度,导致手势识别的准确性下降。其次,构建过程中,研究人员需克服数据采集的困难,确保在各种天气条件下都能获取高质量的手语视频数据。此外,数据集的标注工作也极具挑战性,需要专业知识来准确识别和标注手语动作,以确保训练模型的有效性。这些挑战共同构成了该数据集在手语识别研究中的重要课题。
发展历史
创建时间与更新
RWTH-PHOENIX-Weather 2014数据集由德国亚琛工业大学于2014年创建,旨在为手语识别研究提供高质量的视频和文本数据。该数据集自创建以来未有官方更新记录。
重要里程碑
RWTH-PHOENIX-Weather 2014数据集的发布标志着手语识别领域的一个重要里程碑。它首次整合了德语手语的多模态数据,包括视频、手语翻译文本以及详细的注释信息。这一数据集的推出极大地推动了手语识别技术的研究进展,为后续的算法开发和模型训练提供了坚实的基础。此外,该数据集还促进了跨学科合作,吸引了计算机视觉、自然语言处理和语言学等多个领域的研究者共同参与手语识别的研究。
当前发展情况
目前,RWTH-PHOENIX-Weather 2014数据集已成为手语识别领域的一个基准数据集,广泛应用于各种研究论文和算法评估中。尽管近年来出现了更多新的手语数据集,RWTH-PHOENIX-Weather 2014依然因其高质量和丰富的注释信息而保持其重要地位。该数据集不仅推动了手语识别技术的发展,还促进了手语翻译系统的实际应用,为聋哑人群提供了更便捷的沟通工具。未来,随着技术的进步,该数据集有望继续在手语识别和相关领域发挥重要作用。
发展历程
  • RWTH-PHOENIX-Weather 2014数据集首次发布,该数据集由德国亚琛工业大学(RWTH Aachen University)开发,主要用于手语识别研究。
    2014年
  • RWTH-PHOENIX-Weather 2014数据集首次应用于手语识别领域的研究论文中,展示了其在手语翻译和识别任务中的有效性。
    2015年
  • 该数据集在多个国际会议和期刊上被广泛引用,成为手语识别领域的重要基准数据集之一。
    2017年
  • RWTH-PHOENIX-Weather 2014数据集被用于开发新的深度学习模型,显著提升了手语识别的准确率和效率。
    2019年
  • 该数据集的扩展版本RWTH-PHOENIX-Weather 2014T发布,增加了更多的手语视频和标注数据,进一步丰富了研究资源。
    2021年
常用场景
经典使用场景
在自然语言处理领域,RWTH-PHOENIX-Weather 2014数据集被广泛用于手语识别和翻译的研究。该数据集包含了德语手语视频及其对应的文本注释,为研究人员提供了一个丰富的资源来开发和评估手语识别系统。通过分析视频中的手势、面部表情和身体动作,研究者可以构建模型,实现从手语到文本的自动转换,这在聋哑人社区中具有重要的应用价值。
衍生相关工作
基于RWTH-PHOENIX-Weather 2014数据集,研究者们开展了一系列相关工作,包括手语识别模型的优化、多模态数据处理技术的改进以及跨语言手语翻译系统的开发。这些工作不仅提升了手语识别的准确性和效率,还推动了相关领域的技术进步。例如,一些研究团队利用该数据集开发了基于深度学习的手语识别模型,显著提高了识别精度,并为后续研究提供了新的思路和方法。
数据集最近研究
最新研究方向
在手语识别领域,RWTH-PHOENIX-Weather 2014数据集已成为研究者们探索深度学习模型性能的重要基准。该数据集不仅包含了丰富的手语视频数据,还提供了详细的注释信息,使得研究者能够更精确地评估模型的表现。近年来,随着计算机视觉和自然语言处理技术的融合,研究者们开始尝试将多模态学习应用于手语识别,以提高识别的准确性和鲁棒性。此外,数据集的多样性和复杂性也促使研究者开发更加智能的模型,以应对不同环境下的手语识别挑战。这些前沿研究不仅推动了手语识别技术的发展,也为聋哑人群的沟通提供了更多可能性。
相关研究论文
  • 1
    The RWTH-PHOENIX-Weather 2014 DatasetRWTH Aachen University · 2014年
  • 2
    Sign Language Recognition Using Sequential Pattern TreesRWTH Aachen University · 2016年
  • 3
    Deep Sign: Hybrid CNN-HMM for Continuous Sign Language RecognitionRWTH Aachen University · 2017年
  • 4
    A Survey on Vision-Based Sign Language RecognitionUniversity of Surrey · 2020年
  • 5
    End-to-End Continuous Sign Language Recognition with Spatial-Temporal Multi-Cue NetworkTsinghua University · 2021年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国气象数据

本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。

github 收录

URPC系列数据集, S-URPC2019, UDD

URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。

github 收录

CIFAR-10

CIFAR-10 数据集由 10 个类别的 60000 个 32x32 彩色图像组成,每个类别包含 6000 个图像。有 50000 个训练图像和 10000 个测试图像。 数据集分为五个训练批次和一个测试批次,每个批次有 10000 张图像。测试批次恰好包含来自每个类别的 1000 个随机选择的图像。训练批次包含随机顺序的剩余图像,但一些训练批次可能包含来自一个类的图像多于另一个。在它们之间,训练批次恰好包含来自每个类别的 5000 张图像。

OpenDataLab 收录

koen430/relevant_selected_stock_news

该数据集包含通过GPT-3.5-turbo筛选出的新闻文章,旨在用于微调大型语言模型,以预测新闻发布后的股票价格变动。数据集包括多个特征,如股票代码、提示、文本、URL、结果、相关性、令牌计数等,并分为训练集、验证集和测试集。

hugging_face 收录

中国农村金融统计数据

该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。

www.pbc.gov.cn 收录