ASRU2019 CSASR
收藏OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/ASRU2019_CSASR
下载链接
链接失效反馈官方服务:
资源简介:
数据规模:
200小时
格式:
16kHz,16bit,单声道,无压缩wav
录音环境:
相对安静的室内,无回声
录音内容:
通用类口语句子;交互类句子
录音人:
男女比例均匀;小于25岁67%,26-40岁25%,40岁以上7%;覆盖北方官话区、吴语区、粤语区、闽语区、湘语区、赣语区等
设备:
安卓、苹果
语言:
普通话
应用场景:
语音识别,机器翻译;声纹识别
标注准确率:
97%以上
Data Scale: 200 hours
Format: 16kHz, 16-bit, single-channel, uncompressed WAV
Recording Environment: Relatively quiet indoor space with no echo
Recording Content: General-purpose spoken sentences; interactive sentences
Recording Speakers: Even gender distribution; 67% of speakers are under 25 years old, 25% aged 26-40, and 7% aged over 40; covering Northern Mandarin, Wu Chinese, Cantonese, Min Chinese, Xiang Chinese, Gan Chinese regions and other dialect areas
Recording Equipment: Android and Apple devices
Language: Standard Mandarin
Application Scenarios: Speech recognition, machine translation, speaker verification
Annotation Accuracy: Above 97%
提供机构:
OpenDataLab
创建时间:
2023-06-25
搜集汇总
数据集介绍

背景与挑战
背景概述
ASRU2019 CSASR是一个包含200小时普通话语音的数据集,录音环境安静,覆盖多种方言区和年龄段的说话人,适用于语音识别、机器翻译和声纹识别等任务,标注准确率超过97%。
以上内容由遇见数据集搜集并总结生成



