ASRU2019 ASR

Name: ASRU2019 ASR
Creator: OpenDataLab
Published: 2026-05-17 12:30:42
License: 暂无描述

OpenDataLab2026-05-17 更新2024-05-09 收录

下载链接：

https://opendatalab.org.cn/OpenDataLab/ASRU2019_ASR

下载链接

链接失效反馈

官方服务：

资源简介：

数据规模： 500小时格式： 16kHz 16bit，wav，单声道录音环境：安静的室内；包含不影响语音辨识的背景噪音录音内容：口语化句子录音人：男女比例均匀；≤20岁23%，21~30岁70%，31~40岁4%，40岁以上3%；录音人员分布于广东、福建、山东、江苏、北京、湖南、江西等33省设备：安卓:iOS=9:1 语言：普通话；有口音的普通话应用场景：语音识别；机器翻译；声纹识别标注准确率： 97%以上

Dataset Scale: 500 hours Format: 16kHz, 16-bit, single-channel WAV files Recording Environment: Quiet indoor settings with background noise that does not impede speech recognition Recording Content: Colloquial spoken sentences Speaker Demographics: Equal male-to-female ratio; 23% of speakers aged 20 or younger, 70% aged 21–30, 4% aged 31–40, and 3% aged over 40; speakers are recruited from 33 provinces including Guangdong, Fujian, Shandong, Jiangsu, Beijing, Hunan, Jiangxi, etc. Recording Devices: Android-to-iOS device ratio of 9:1 Languages: Standard Mandarin Chinese and accented Mandarin Chinese Application Scenarios: Speech recognition, machine translation, voiceprint recognition Annotation Accuracy: Over 97%

提供机构：

OpenDataLab

创建时间：

2023-06-25

搜集汇总

数据集介绍

背景与挑战

背景概述

ASRU2019 ASR是一个500小时的普通话语音识别数据集，包含16kHz 16bit的单声道wav音频，录音环境为安静的室内并带有背景噪音，录音内容为口语化句子。数据集覆盖了广泛的年龄和地域分布，录音人男女比例均匀，设备以安卓为主，适用于语音识别、机器翻译和声纹识别等场景，标注准确率超过97%。该数据集由数据堂（北京）科技股份有限公司于2019年发布。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集