粤语简体语音识别Common Voice学术数据集
收藏魔搭社区2026-05-24 更新2024-05-15 收录
下载链接:
https://modelscope.cn/datasets/modelscope/speech_asr_commonvoice_cantonese-CHS_trainsets
下载链接
链接失效反馈官方服务:
资源简介:
应用于粤语简体语音识别模型(speech_UniASR_asr_2pass-cantonese-CHS-16k-common-vocab1468-tensorflow1)的Common Voice训练集、开发集、测试集
适用于粤语简体语音识别模型(speech_UniASR_asr_2pass-cantonese-CHS-16k-common-vocab1468-tensorflow1)的通用语音(Common Voice)训练集、开发集与测试集
提供机构:
maas
创建时间:
2023-01-30
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集是Common Voice项目中的粤语简体语音识别学术数据集,包含训练集、开发集和测试集,音频格式为16KHz采样率的单通道wav文件,适用于语音识别模型的训练和测试。数据集由Mozilla基金会发起,采用众包方式收集,支持学术研究但禁止商用。
以上内容由遇见数据集搜集并总结生成



