数据堂—388小时西班牙人说英语手机采集语音数据
收藏魔搭社区2025-06-04 更新2024-05-15 收录
下载链接:
https://modelscope.cn/datasets/DatatangBeijing/388Hours-SpanishSpeakingEnglishSpeechDataByMobilePhone
下载链接
链接失效反馈官方服务:
资源简介:
388小时西班牙人说英语手机采集语音数据是由891名西班牙人参与录制,口音正宗。录音文本由语言专家参与设计,涵盖通用、交互、车载、家居等多类别,内容丰富。文本经过人工校对,准确率高。匹配主流安卓、苹果系统手机。本套西班牙人说英语手机采集语音数据可应用于语音识别、机器翻译等场景
This 388-hour mobile-collected English speech dataset spoken by Spanish native speakers features authentic accents, with recordings conducted by 891 Spanish participants. The accompanying transcriptions were developed by linguistic experts, covering multiple categories including general scenarios, interactive scenarios, in-vehicle scenarios and smart home scenarios, with rich and varied content. All transcriptions have undergone manual proofreading, ensuring high accuracy. This dataset is compatible with mainstream Android and Apple iOS mobile devices, and can be applied to scenarios such as speech recognition and machine translation.
提供机构:
maas
创建时间:
2024-05-06
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集包含388小时由891名西班牙母语者通过手机采集的英语语音数据,旨在评估英语语音识别模型。录音内容涵盖通用话题、交互场景、车载及家居命令等多个类别,所有转录文本均经过人工校对,准确率不低于98%。数据以16kHz、16位、单声道WAV格式提供,适用于语音识别和机器翻译等任务。
以上内容由遇见数据集搜集并总结生成



