MagicData——ASR-CSTRMACSTCSC中文浓重普通话口音会话语音语料库
收藏魔搭社区2026-05-09 更新2024-05-15 收录
下载链接:
https://modelscope.cn/datasets/MagicData/A_CHINESE_STRONG_MANDARIN_ACCENT_CONVERSATIONAL_SPEECH_CORPUS
下载链接
链接失效反馈官方服务:
资源简介:
该数据集由适用于自动语音识别的58.78小时的普通话强口音会话语音组成,其中包含从20名男性和21名女性(16-42岁)收集的138条话语。
This dataset consists of 58.78 hours of Mandarin conversational speech with strong accents, intended for automatic speech recognition (ASR), and includes 138 utterances collected from 20 male and 21 female participants aged between 16 and 42 years old.
提供机构:
maas
创建时间:
2024-03-12
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集包含58.78小时的中文浓重普通话口音会话语音,适用于自动语音识别任务,由MagicData版权所有,仅支持学术研究,禁止未经许可的商业使用。数据格式为16kHz、16位音频和文本,采集自20名男性和21名女性,共138条话语。
以上内容由遇见数据集搜集并总结生成



