RWTH-PHOENIX-Weather_2014
收藏魔搭社区2025-12-30 更新2024-08-31 收录
下载链接:
https://modelscope.cn/datasets/OmniData/RWTH-PHOENIX-Weather_2014
下载链接
链接失效反馈官方服务:
资源简介:
displayName: RWTH-PHOENIX-Weather 2014
labelTypes:
- Classification
license:
- CC BY-NC-SA 3.0
mediaTypes:
- Video
paperUrl: https://www-i6.informatik.rwth-aachen.de/publications/download/996/Koller-CVIU-2015.pdf
publishDate: "2014"
publishUrl: https://www-i6.informatik.rwth-aachen.de/~koller/RWTH-PHOENIX/
publisher:
- RWTH Aachen University
tags:
- Hand
taskTypes:
- Sign Language Recognition
---
# 数据集介绍
## 简介
在三年(2009 - 2011 年)期间,德国公共电视台 PHOENIX 以手语翻译为特色的每日新闻和天气预报播出已被记录。目前,只有 386 个版本的子集的天气预报使用光泽符号转录。转录是由以德语手语为母语的聋哑人和听力障碍者进行的。此外,德语口语天气预报已使用 RASR 语音识别系统以半自动方式转录。此外,还创建了将注释翻译成德语口语的附加翻译,以捕获允许的翻译可变性。签名由放置在手语翻译前的固定彩色摄像机记录下来。口译员在带有颜色过渡的人造灰色背景前穿着深色衣服。所有录制的视频均为每秒 25 帧,帧大小为 210 x 260 像素。每个框架仅显示解释器框。由于法律限制,RWTH 无法发布 ELAN xml 格式的原始注释文件和录制的视频序列。而是提供了包含具有相应 id 的真实光泽注释以及与这些 id 对应的图像序列的 xml 文件。
## 引文
```
"@article{koller2015continuous,
title={Continuous sign language recognition: Towards large vocabulary statistical recognition systems handling multiple signers},
author={Koller, Oscar and Forster, Jens and Ney, Hermann},
journal={Computer Vision and Image Understanding},
volume={141},
pages={108--125},
year={2015},
publisher={Elsevier}
}"
```
## Download dataset
:modelscope-code[]{type="git"}
displayName: RWTH-PHOENIX-Weather 2014
labelTypes:
- 分类(Classification)
license:
- 知识共享署名-非商业性使用-相同方式共享3.0(CC BY-NC-SA 3.0)
mediaTypes:
- 视频(Video)
paperUrl: https://www-i6.informatik.rwth-aachen.de/publications/download/996/Koller-CVIU-2015.pdf
publishDate: 2014年
publishUrl: https://www-i6.informatik.rwth-aachen.de/~koller/RWTH-PHOENIX/
publisher:
- 亚琛工业大学(RWTH Aachen University)
tags:
- 手部(Hand)
taskTypes:
- 手语识别(Sign Language Recognition)
---
# 数据集介绍
## 简介
2009年至2011年三年间,德国公共电视台PHOENIX的手语译制每日新闻与天气预报节目均被录制留存。当前仅开放386段天气预报子片段的数据集子集,该子集采用手语gloss标注转录。标注工作由以德国手语为母语的聋哑人士及听障群体完成。此外,德语口语版天气预报已通过RASR语音识别系统完成半自动转录,并额外创建了针对标注内容的德语口语译版,以覆盖允许的翻译变体。
手语译员的录制场景为:身着深色服装,在带有色彩过渡的人造灰色背景前,由固定机位的彩色摄像机拍摄(拍摄视角正对译员前方)。所有录制视频均为25帧/秒,分辨率为210×260像素,单帧画面仅包含译员区域。受法律条款限制,RWTH无法公开ELAN XML格式的原始标注文件与完整视频序列,仅提供包含对应ID的真实gloss标注及匹配该ID的图像序列的XML文件。
## 引文
"@article{koller2015continuous,
title={Continuous sign language recognition: Towards large vocabulary statistical recognition systems handling multiple signers},
author={Koller, Oscar and Forster, Jens and Ney, Hermann},
journal={Computer Vision and Image Understanding},
volume={141},
pages={108--125},
year={2015},
publisher={Elsevier}
}"
## 数据集下载
:modelscope-code[]{type="git"}
提供机构:
maas
创建时间:
2024-07-17



