ASRU2019 ASR
收藏OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/ASRU2019_ASR
下载链接
链接失效反馈官方服务:
资源简介:
数据规模:
500小时
格式:
16kHz 16bit,wav,单声道
录音环境:
安静的室内;包含不影响语音辨识的背景噪音
录音内容:
口语化句子
录音人:
男女比例均匀;≤20岁23%,21~30岁70%,31~40岁4%,40岁以上3%;录音人员分布于广东、福建、山东、江苏、北京、湖南、江西等33省
设备:
安卓:iOS=9:1
语言:
普通话;有口音的普通话
应用场景:
语音识别;机器翻译;声纹识别
标注准确率:
97%以上
Dataset Scale: 500 hours
Format: 16kHz, 16-bit, single-channel WAV files
Recording Environment: Quiet indoor settings with background noise that does not impede speech recognition
Recording Content: Colloquial spoken sentences
Speaker Demographics: Equal male-to-female ratio; 23% of speakers aged 20 or younger, 70% aged 21–30, 4% aged 31–40, and 3% aged over 40; speakers are recruited from 33 provinces including Guangdong, Fujian, Shandong, Jiangsu, Beijing, Hunan, Jiangxi, etc.
Recording Devices: Android-to-iOS device ratio of 9:1
Languages: Standard Mandarin Chinese and accented Mandarin Chinese
Application Scenarios: Speech recognition, machine translation, voiceprint recognition
Annotation Accuracy: Over 97%
提供机构:
OpenDataLab
创建时间:
2023-06-25
搜集汇总
数据集介绍

背景与挑战
背景概述
ASRU2019 ASR是一个500小时的普通话语音识别数据集,包含16kHz 16bit的单声道wav音频,录音环境为安静的室内并带有背景噪音,录音内容为口语化句子。数据集覆盖了广泛的年龄和地域分布,录音人男女比例均匀,设备以安卓为主,适用于语音识别、机器翻译和声纹识别等场景,标注准确率超过97%。该数据集由数据堂(北京)科技股份有限公司于2019年发布。
以上内容由遇见数据集搜集并总结生成



