five

RWTH-PHOENIX-Weather_2014

收藏
魔搭社区2025-12-30 更新2024-08-31 收录
下载链接:
https://modelscope.cn/datasets/OmniData/RWTH-PHOENIX-Weather_2014
下载链接
链接失效反馈
官方服务:
资源简介:
displayName: RWTH-PHOENIX-Weather 2014 labelTypes: - Classification license: - CC BY-NC-SA 3.0 mediaTypes: - Video paperUrl: https://www-i6.informatik.rwth-aachen.de/publications/download/996/Koller-CVIU-2015.pdf publishDate: "2014" publishUrl: https://www-i6.informatik.rwth-aachen.de/~koller/RWTH-PHOENIX/ publisher: - RWTH Aachen University tags: - Hand taskTypes: - Sign Language Recognition --- # 数据集介绍 ## 简介 在三年(2009 - 2011 年)期间,德国公共电视台 PHOENIX 以手语翻译为特色的每日新闻和天气预报播出已被记录。目前,只有 386 个版本的子集的天气预报使用光泽符号转录。转录是由以德语手语为母语的聋哑人和听力障碍者进行的。此外,德语口语天气预报已使用 RASR 语音识别系统以半自动方式转录。此外,还创建了将注释翻译成德语口语的附加翻译,以捕获允许的翻译可变性。签名由放置在手语翻译前的固定彩色摄像机记录下来。口译员在带有颜色过渡的人造灰色背景前穿着深色衣服。所有录制的视频均为每秒 25 帧,帧大小为 210 x 260 像素。每个框架仅显示解释器框。由于法律限制,RWTH 无法发布 ELAN xml 格式的原始注释文件和录制的视频序列。而是提供了包含具有相应 id 的真实光泽注释以及与这些 id 对应的图像序列的 xml 文件。 ## 引文 ``` "@article{koller2015continuous, title={Continuous sign language recognition: Towards large vocabulary statistical recognition systems handling multiple signers}, author={Koller, Oscar and Forster, Jens and Ney, Hermann}, journal={Computer Vision and Image Understanding}, volume={141}, pages={108--125}, year={2015}, publisher={Elsevier} }" ``` ## Download dataset :modelscope-code[]{type="git"}

displayName: RWTH-PHOENIX-Weather 2014 labelTypes: - 分类(Classification) license: - 知识共享署名-非商业性使用-相同方式共享3.0(CC BY-NC-SA 3.0) mediaTypes: - 视频(Video) paperUrl: https://www-i6.informatik.rwth-aachen.de/publications/download/996/Koller-CVIU-2015.pdf publishDate: 2014年 publishUrl: https://www-i6.informatik.rwth-aachen.de/~koller/RWTH-PHOENIX/ publisher: - 亚琛工业大学(RWTH Aachen University) tags: - 手部(Hand) taskTypes: - 手语识别(Sign Language Recognition) --- # 数据集介绍 ## 简介 2009年至2011年三年间,德国公共电视台PHOENIX的手语译制每日新闻与天气预报节目均被录制留存。当前仅开放386段天气预报子片段的数据集子集,该子集采用手语gloss标注转录。标注工作由以德国手语为母语的聋哑人士及听障群体完成。此外,德语口语版天气预报已通过RASR语音识别系统完成半自动转录,并额外创建了针对标注内容的德语口语译版,以覆盖允许的翻译变体。 手语译员的录制场景为:身着深色服装,在带有色彩过渡的人造灰色背景前,由固定机位的彩色摄像机拍摄(拍摄视角正对译员前方)。所有录制视频均为25帧/秒,分辨率为210×260像素,单帧画面仅包含译员区域。受法律条款限制,RWTH无法公开ELAN XML格式的原始标注文件与完整视频序列,仅提供包含对应ID的真实gloss标注及匹配该ID的图像序列的XML文件。 ## 引文 "@article{koller2015continuous, title={Continuous sign language recognition: Towards large vocabulary statistical recognition systems handling multiple signers}, author={Koller, Oscar and Forster, Jens and Ney, Hermann}, journal={Computer Vision and Image Understanding}, volume={141}, pages={108--125}, year={2015}, publisher={Elsevier} }" ## 数据集下载 :modelscope-code[]{type="git"}
提供机构:
maas
创建时间:
2024-07-17
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作