数据堂—1,002小时俄语手机采集语音数据
收藏魔搭社区2025-10-23 更新2024-05-15 收录
下载链接:
https://modelscope.cn/datasets/DatatangBeijing/1002Hours-RussianSpeechDataByMobilePhone
下载链接
链接失效反馈官方服务:
资源简介:
1,002小时俄语手机采集语音数据是由1960名俄罗斯本土发音人参与录制,口音正宗。录音文本由语言专家参与设计,涵盖通用、交互、车载、家居等多类别,内容丰富。本套俄语手机采集语音数据的文本经过人工校对,准确率高。匹配主流安卓、苹果系统手机
The 1,002-hour Russian speech dataset collected via mobile phones was recorded by 1,960 native Russian speakers with authentic accents. The transcribed texts were designed by linguistic experts, covering multiple categories including general scenarios, interactive scenarios, in-vehicle scenarios and smart home scenarios, with rich and diverse content. The transcribed texts of this Russian mobile-collected speech dataset have undergone manual proofreading, ensuring high accuracy. This dataset is compatible with mainstream Android and Apple iOS mobile phones.
提供机构:
maas
创建时间:
2024-05-07
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集包含1,002小时的俄语手机采集语音数据,由1,960名母语者录制,覆盖通用、交互、车载和家庭命令等多种场景,适用于俄语语音识别模型的测试任务。数据格式为16kHz、16bit的WAV音频,经过人工校对确保高准确性。
以上内容由遇见数据集搜集并总结生成



