five

Nexdata/German_Speech_Data_by_Mobile_Phone

收藏
Hugging Face2024-04-17 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Nexdata/German_Speech_Data_by_Mobile_Phone
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含由3,442名德语母语者通过手机录制的1,796小时的德语音频数据。录音文本由语言专家设计,涵盖通用、交互、车载、家庭等类别,并经过人工校对,具有高准确性。该数据集可用于自动语音识别、机器翻译和声纹识别等任务。

This dataset contains 1,796 hours of German audio data recorded by 3,442 German native speakers using mobile phones. The corresponding text materials for the recordings were designed by linguistic experts, covering scenarios such as general, conversational, in-vehicle and home environments, and have undergone manual proofreading to ensure high accuracy. This dataset can be applied to tasks including automatic speech recognition (ASR), machine translation (MT) and speaker verification.
提供机构:
Nexdata
原始信息汇总

数据集概述

数据集名称

  • 名称: Nexdata/German_Speech_Data_by_Mobile_Phone

数据集描述

  • 摘要: 该数据集包含由3,442名德国母语者通过移动电话录制的德语音频数据,总计1,796小时。录音文本由语言专家设计,涵盖通用、交互、车载、家居等多个类别,并经过人工校对,具有高准确性。适用于自动语音识别、机器翻译和声纹识别等任务。
  • 支持的任务: 自动语音识别(ASR)、音频说话人识别。
  • 语言: 德语

数据集结构

  • 数据实例: [信息待补充]
  • 数据字段: [信息待补充]
  • 数据分割: [信息待补充]

数据集创建

  • 来源数据: [信息待补充]
  • 注释过程: [信息待补充]
  • 个人和敏感信息: [信息待补充]

使用数据注意事项

  • 社会影响: [信息待补充]
  • 偏见讨论: [信息待补充]
  • 其他已知限制: [信息待补充]

附加信息

  • 许可证信息: 商业许可证,详情见链接:商业许可证
  • 数据集管理员: [信息待补充]
  • 引用信息: [信息待补充]
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作