five

lukasbraach/rwth_phoenix_weather_2014|手语识别数据集|深度学习数据集

收藏
hugging_face2024-06-10 更新2024-03-04 收录
手语识别
深度学习
下载链接:
https://hf-mirror.com/datasets/lukasbraach/rwth_phoenix_weather_2014
下载链接
链接失效反馈
资源简介:
RWTH-Weather-Phoenix 2014数据集包含两个子集:multisigner set和signer independent set。该数据集主要用于连续手语识别任务,包含视频帧和对应的文本转录。数据集分为训练集、验证集和测试集,每个子集都有不同的配置和特征。数据集发布在非商业cc 4.0许可下,并要求在使用时引用相关研究论文。
提供机构:
lukasbraach
原始信息汇总

数据集概述

数据集配置

多说话者配置(multisigner)

  • 特征:
    • id: 字符串类型
    • transcription: 字符串类型
    • frames: 图像序列
  • 分割:
    • train: 35,090,755,574 字节, 5,672 个样本
    • validation: 3,294,869,318 字节, 540 个样本
    • test: 3,935,898,314 字节, 629 个样本
  • 下载大小: 43,042,303,939 字节
  • 数据集大小: 42,321,523,206 字节

预训练配置(pre-training)

  • 特征:
    • id: 字符串类型
    • transcription: 字符串类型
  • 分割:
    • train: 744,118 字节, 5,672 个样本
    • validation: 63,848 字节, 540 个样本
    • test: 75,329 字节, 629 个样本
  • 下载大小: 43,042,303,939 字节
  • 数据集大小: 883,295 字节

说话者独立配置(signerindependent)

  • 特征:
    • id: 字符串类型
    • transcription: 字符串类型
    • frames: 图像序列
  • 分割:
    • train: 26,933,922,764 字节, 4,376 个样本
    • validation: 720,569,029 字节, 111 个样本
    • test: 1,175,797,903 字节, 180 个样本
  • 下载大小: 29,320,607,031 字节
  • 数据集大小: 28,830,289,696 字节
AI搜集汇总
数据集介绍
main_image_url
构建方式
lukasbraach/rwth_phoenix_weather_2014数据集的构建,采取了对RWTH-Weather-Phoenix 2014语料库的两种设置进行整合的方式,分别为多签名者集和独立签名者集。该数据集的构建涉及对视频帧的提取、转写文本的对应以及唯一标识符的分配,确保了数据的一致性和可用性。
使用方法
使用该数据集时,用户需遵循相应的许可证规定,并在研究中引用相关文献。数据集分为训练、验证和测试集,可通过下载相应的配置来获取。用户可以根据需要选择多签名者集或独立签名者集进行手语识别模型的训练和评估。
背景与挑战
背景概述
RWTH-Weather-Phoenix 2014数据集,由德国亚琛工业大学(RWTH Aachen University)的研究人员O. Koller、J. Forster和H. Ney于2016年创建,是用于连续手语识别的重要资源。该数据集旨在推动大型词汇量的统计识别系统,能够处理多个手语使用者。数据集的核心研究问题是提升手语识别的准确度和实用性,对手语识别领域产生了深远的影响。
当前挑战
该数据集面临的挑战主要包括:1) 多个手语使用者的识别问题,需要解决不同个体间的手势差异;2) 在构建过程中,数据集的自动帧对齐、语言模型构建及超参数的优化等都是技术上的难点。此外,数据集的标注和预处理工作也极具挑战性,确保了研究结果的准确性和可重复性。
常用场景
经典使用场景
在自然语言处理与计算机视觉的交叉领域,lukasbraach/rwth_phoenix_weather_2014数据集被广泛用于连续手语识别的研究。该数据集包含了多签名者的视频序列及其对应的字幕,使得研究者能够训练模型识别并翻译手语表达。
解决学术问题
该数据集解决了多签名者手语识别中的变异性问题,为学术研究提供了处理多模态数据的基准。其丰富的注释和视频帧级数据使得研究者能够深入探索手语表达的时空特征,进而提高识别的准确度和鲁棒性。
实际应用
在实际应用中,该数据集有助于开发辅助听障人士的沟通工具,以及构建更加人性化的交互系统。通过对手语的理解和翻译,可以为听障人士提供更加便捷的信息获取方式。
数据集最近研究
最新研究方向
在连续手语识别领域,lukasbraach/rwth_phoenix_weather_2014数据集作为重要资源,近期研究集中于提升多签名者及独立签名者的识别准确性。研究围绕深度学习模型,尤其是结合卷积神经网络与隐马尔可夫模型(CNN-HMM)的端到端序列建模技术,旨在实现大词汇量的统计识别系统。此数据集在多模态通信与人工智能辅助交流中扮演关键角色,其研究成果对于促进听障人士的沟通与信息获取具有重要意义。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

ChemBL

ChemBL是一个化学信息学数据库,包含大量生物活性数据,涵盖了药物发现和开发过程中的各种化学实体。数据集包括化合物的结构信息、生物活性数据、靶点信息等。

www.ebi.ac.uk 收录

poi

本项目收集国内POI兴趣点,当前版本数据来自于openstreetmap。

github 收录

HIT-UAV

HIT-UAV数据集包含2898张红外热成像图像,这些图像从43,470帧无人机拍摄的画面中提取。数据集涵盖了多种场景,如学校、停车场、道路和游乐场,在不同的光照条件下,包括白天和夜晚。

github 收录

CE-CSL

CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。

arXiv 收录

MOOCs Dataset

该数据集包含了大规模开放在线课程(MOOCs)的相关数据,包括课程信息、用户行为、学习进度等。数据主要用于研究在线教育的行为模式和学习效果。

www.kaggle.com 收录