数据堂—230小时俄罗斯人说英语手机采集语音数据
收藏魔搭社区2025-12-26 更新2024-05-15 收录
下载链接:
https://modelscope.cn/datasets/DatatangBeijing/230Hours_RussianSpeakingEnglishSpeechDataByMobilePhone
下载链接
链接失效反馈官方服务:
资源简介:
230小时俄罗斯人说英语手机采集语音数据是由498名俄罗斯人参与录制,性别分布均衡。录音文本涵盖通用、交互、车载、家居等多类别,内容丰富。本套俄罗斯人说英语手机采集语音数据的文本经过人工校对,准确率高。
This 230-hour English speech dataset was collected via mobile devices from 498 Russian participants with a balanced gender distribution. Its accompanying transcriptions cover multiple categories including general, conversational, in-vehicle, and smart home scenarios, featuring rich and diverse content. All transcriptions of this dataset have been manually proofread, ensuring high accuracy.
提供机构:
maas
创建时间:
2022-12-22
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集包含230小时由498名俄罗斯人通过手机录制的英语语音,覆盖通用、交互、车载及家庭命令等多种场景,音频格式为16kHz单声道WAV。它专用于测试俄式英语语音识别模型,文本内容经过人工校对确保准确性。
以上内容由遇见数据集搜集并总结生成



