Nexdata/German_Speech_Data_by_Mobile_Phone
收藏Hugging Face2024-04-17 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Nexdata/German_Speech_Data_by_Mobile_Phone
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含由3,442名德语母语者通过手机录制的1,796小时的德语音频数据。录音文本由语言专家设计,涵盖通用、交互、车载、家庭等类别,并经过人工校对,具有高准确性。该数据集可用于自动语音识别、机器翻译和声纹识别等任务。
This dataset contains 1,796 hours of German audio data recorded by 3,442 German native speakers using mobile phones. The corresponding text materials for the recordings were designed by linguistic experts, covering scenarios such as general, conversational, in-vehicle and home environments, and have undergone manual proofreading to ensure high accuracy. This dataset can be applied to tasks including automatic speech recognition (ASR), machine translation (MT) and speaker verification.
提供机构:
Nexdata
原始信息汇总
数据集概述
数据集名称
- 名称: Nexdata/German_Speech_Data_by_Mobile_Phone
数据集描述
- 摘要: 该数据集包含由3,442名德国母语者通过移动电话录制的德语音频数据,总计1,796小时。录音文本由语言专家设计,涵盖通用、交互、车载、家居等多个类别,并经过人工校对,具有高准确性。适用于自动语音识别、机器翻译和声纹识别等任务。
- 支持的任务: 自动语音识别(ASR)、音频说话人识别。
- 语言: 德语
数据集结构
- 数据实例: [信息待补充]
- 数据字段: [信息待补充]
- 数据分割: [信息待补充]
数据集创建
- 来源数据: [信息待补充]
- 注释过程: [信息待补充]
- 个人和敏感信息: [信息待补充]
使用数据注意事项
- 社会影响: [信息待补充]
- 偏见讨论: [信息待补充]
- 其他已知限制: [信息待补充]
附加信息
- 许可证信息: 商业许可证,详情见链接:商业许可证
- 数据集管理员: [信息待补充]
- 引用信息: [信息待补充]



