数据堂—211小时德语手机采集语音数据_朗读
收藏魔搭社区2024-11-29 更新2024-05-15 收录
下载链接:
https://modelscope.cn/datasets/DatatangBeijing/211Hours-GermanSpeechDataByMobilePhone
下载链接
链接失效反馈官方服务:
资源简介:
211小时德语手机采集语音数据通过327名德国本土人员参与采集录制。录音文本内容丰富,包括经济、娱乐、新闻、口语、数字、字母等;平均句长10.3词,句子平均重复1.4次。211小时德语手机采集语音数据所有文本由人工转写,准确率高
A 211-hour German speech dataset collected via mobile phones was recorded by 327 native German speakers. The transcribed texts cover diverse topics including economy, entertainment, news, colloquial speech, numbers and letters. The average sentence length is 10.3 words, and each sentence is repeated an average of 1.4 times. All texts of this dataset were manually transcribed with high accuracy.
提供机构:
maas
创建时间:
2024-05-06
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集包含211小时的德语语音数据,由327名母语者通过手机采集,内容涵盖经济、娱乐、新闻等多个主题,平均句子长度为10.3词。数据以16kHz采样率的WAV格式存储,主要用于德语语音识别模型的评估任务。
以上内容由遇见数据集搜集并总结生成



