five

ASRU2019 CSASR

收藏
OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/ASRU2019_CSASR
下载链接
链接失效反馈
官方服务:
资源简介:
数据规模: 200小时 格式: 16kHz,16bit,单声道,无压缩wav 录音环境: 相对安静的室内,无回声 录音内容: 通用类口语句子;交互类句子 录音人: 男女比例均匀;小于25岁67%,26-40岁25%,40岁以上7%;覆盖北方官话区、吴语区、粤语区、闽语区、湘语区、赣语区等 设备: 安卓、苹果 语言: 普通话 应用场景: 语音识别,机器翻译;声纹识别 标注准确率: 97%以上

Data Scale: 200 hours Format: 16kHz, 16-bit, single-channel, uncompressed WAV Recording Environment: Relatively quiet indoor space with no echo Recording Content: General-purpose spoken sentences; interactive sentences Recording Speakers: Even gender distribution; 67% of speakers are under 25 years old, 25% aged 26-40, and 7% aged over 40; covering Northern Mandarin, Wu Chinese, Cantonese, Min Chinese, Xiang Chinese, Gan Chinese regions and other dialect areas Recording Equipment: Android and Apple devices Language: Standard Mandarin Application Scenarios: Speech recognition, machine translation, speaker verification Annotation Accuracy: Above 97%
提供机构:
OpenDataLab
创建时间:
2023-06-25
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
ASRU2019 CSASR是一个包含200小时普通话语音的数据集,录音环境安静,覆盖多种方言区和年龄段的说话人,适用于语音识别、机器翻译和声纹识别等任务,标注准确率超过97%。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作