five

ASRU2019 ASR

收藏
OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/ASRU2019_ASR
下载链接
链接失效反馈
官方服务:
资源简介:
数据规模: 500小时 格式: 16kHz 16bit,wav,单声道 录音环境: 安静的室内;包含不影响语音辨识的背景噪音 录音内容: 口语化句子 录音人: 男女比例均匀;≤20岁23%,21~30岁70%,31~40岁4%,40岁以上3%;录音人员分布于广东、福建、山东、江苏、北京、湖南、江西等33省 设备: 安卓:iOS=9:1 语言: 普通话;有口音的普通话 应用场景: 语音识别;机器翻译;声纹识别 标注准确率: 97%以上

Dataset Scale: 500 hours Format: 16kHz, 16-bit, single-channel WAV files Recording Environment: Quiet indoor settings with background noise that does not impede speech recognition Recording Content: Colloquial spoken sentences Speaker Demographics: Equal male-to-female ratio; 23% of speakers aged 20 or younger, 70% aged 21–30, 4% aged 31–40, and 3% aged over 40; speakers are recruited from 33 provinces including Guangdong, Fujian, Shandong, Jiangsu, Beijing, Hunan, Jiangxi, etc. Recording Devices: Android-to-iOS device ratio of 9:1 Languages: Standard Mandarin Chinese and accented Mandarin Chinese Application Scenarios: Speech recognition, machine translation, voiceprint recognition Annotation Accuracy: Over 97%
提供机构:
OpenDataLab
创建时间:
2023-06-25
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
ASRU2019 ASR是一个500小时的普通话语音识别数据集,包含16kHz 16bit的单声道wav音频,录音环境为安静的室内并带有背景噪音,录音内容为口语化句子。数据集覆盖了广泛的年龄和地域分布,录音人男女比例均匀,设备以安卓为主,适用于语音识别、机器翻译和声纹识别等场景,标注准确率超过97%。该数据集由数据堂(北京)科技股份有限公司于2019年发布。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作