数据堂—198小时马来人说英语手机采集语音数据
收藏魔搭社区2026-01-06 更新2024-05-15 收录
下载链接:
https://modelscope.cn/datasets/DatatangBeijing/198Hours-MalaysianEnglishSpeechDataByMobilePhone
下载链接
链接失效反馈官方服务:
资源简介:
198小时马来人说英语语音数据是由423名马来人参与录制,性别分布均衡。录音文本涵盖通用、交互、车载、家居等多类别,内容丰富。本套马来人说英语语音数据的文本经过人工校对,准确率高
This 198-hour English speech dataset was recorded by 423 Malay participants with a balanced gender distribution. The accompanying transcribed texts cover multiple categories including general domain, conversational scenarios, in-vehicle scenarios and smart home scenarios, featuring rich and diverse content. All transcribed texts of this dataset have undergone manual proofreading, ensuring high annotation accuracy.
提供机构:
maas
创建时间:
2022-12-22
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集包含198小时由423名马来西亚参与者通过手机录制的英语语音数据,内容涵盖通用对话、交互、车载和家庭命令等多个类别,并经过人工校对确保高准确率。它主要用于测试马来人说英语语音识别模型,数据格式为16kHz、16位单声道WAV文件。
以上内容由遇见数据集搜集并总结生成



