RWTH-PHOENIX-Weather_2014

Name: RWTH-PHOENIX-Weather_2014
Creator: maas
Published: 2025-12-30 13:02:09
License: 暂无描述

魔搭社区2025-12-30 更新2024-08-31 收录

下载链接：

https://modelscope.cn/datasets/OmniData/RWTH-PHOENIX-Weather_2014

下载链接

链接失效反馈

官方服务：

资源简介：

displayName: RWTH-PHOENIX-Weather 2014 labelTypes: - Classification license: - CC BY-NC-SA 3.0 mediaTypes: - Video paperUrl: https://www-i6.informatik.rwth-aachen.de/publications/download/996/Koller-CVIU-2015.pdf publishDate: "2014" publishUrl: https://www-i6.informatik.rwth-aachen.de/~koller/RWTH-PHOENIX/ publisher: - RWTH Aachen University tags: - Hand taskTypes: - Sign Language Recognition --- # 数据集介绍 ## 简介在三年（2009 - 2011 年）期间，德国公共电视台 PHOENIX 以手语翻译为特色的每日新闻和天气预报播出已被记录。目前，只有 386 个版本的子集的天气预报使用光泽符号转录。转录是由以德语手语为母语的聋哑人和听力障碍者进行的。此外，德语口语天气预报已使用 RASR 语音识别系统以半自动方式转录。此外，还创建了将注释翻译成德语口语的附加翻译，以捕获允许的翻译可变性。签名由放置在手语翻译前的固定彩色摄像机记录下来。口译员在带有颜色过渡的人造灰色背景前穿着深色衣服。所有录制的视频均为每秒 25 帧，帧大小为 210 x 260 像素。每个框架仅显示解释器框。由于法律限制，RWTH 无法发布 ELAN xml 格式的原始注释文件和录制的视频序列。而是提供了包含具有相应 id 的真实光泽注释以及与这些 id 对应的图像序列的 xml 文件。 ## 引文 ``` "@article{koller2015continuous, title={Continuous sign language recognition: Towards large vocabulary statistical recognition systems handling multiple signers}, author={Koller, Oscar and Forster, Jens and Ney, Hermann}, journal={Computer Vision and Image Understanding}, volume={141}, pages={108--125}, year={2015}, publisher={Elsevier} }" ``` ## Download dataset :modelscope-code[]{type="git"}

displayName: RWTH-PHOENIX-Weather 2014 labelTypes: - 分类（Classification） license: - 知识共享署名-非商业性使用-相同方式共享3.0（CC BY-NC-SA 3.0） mediaTypes: - 视频（Video） paperUrl: https://www-i6.informatik.rwth-aachen.de/publications/download/996/Koller-CVIU-2015.pdf publishDate: 2014年 publishUrl: https://www-i6.informatik.rwth-aachen.de/~koller/RWTH-PHOENIX/ publisher: - 亚琛工业大学（RWTH Aachen University） tags: - 手部（Hand） taskTypes: - 手语识别（Sign Language Recognition） --- # 数据集介绍 ## 简介 2009年至2011年三年间，德国公共电视台PHOENIX的手语译制每日新闻与天气预报节目均被录制留存。当前仅开放386段天气预报子片段的数据集子集，该子集采用手语gloss标注转录。标注工作由以德国手语为母语的聋哑人士及听障群体完成。此外，德语口语版天气预报已通过RASR语音识别系统完成半自动转录，并额外创建了针对标注内容的德语口语译版，以覆盖允许的翻译变体。手语译员的录制场景为：身着深色服装，在带有色彩过渡的人造灰色背景前，由固定机位的彩色摄像机拍摄（拍摄视角正对译员前方）。所有录制视频均为25帧/秒，分辨率为210×260像素，单帧画面仅包含译员区域。受法律条款限制，RWTH无法公开ELAN XML格式的原始标注文件与完整视频序列，仅提供包含对应ID的真实gloss标注及匹配该ID的图像序列的XML文件。 ## 引文 "@article{koller2015continuous, title={Continuous sign language recognition: Towards large vocabulary statistical recognition systems handling multiple signers}, author={Koller, Oscar and Forster, Jens and Ney, Hermann}, journal={Computer Vision and Image Understanding}, volume={141}, pages={108--125}, year={2015}, publisher={Elsevier} }" ## 数据集下载 :modelscope-code[]{type="git"}

提供机构：

maas

创建时间：

2024-07-17

5,000+

优质数据集

54 个

任务类型

进入经典数据集