five

MagicData——ASR-SCKWSPTSC脚本化中文关键词识别语音语料库

收藏
魔搭社区2026-05-01 更新2024-05-15 收录
下载链接:
https://modelscope.cn/datasets/MagicData/Mandarin_Chinese_Scripted_Speech_Corpus_footprint_keyword
下载链接
链接失效反馈
官方服务:
资源简介:
该开源数据集由6小时转录的中文普通话脚本语音(快、中、慢三种速度的关键词识别)组成,其中包含37位说话者贡献的11,030条话语。

This open-source dataset consists of 6 hours of transcribed Mandarin Chinese scripted speech for keyword recognition across three speeds: fast, medium, and slow, containing 11,030 utterances contributed by 37 speakers.
提供机构:
maas
创建时间:
2024-03-12
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集是一个开源的中文脚本语音语料库,专门用于关键词识别任务,包含6小时的转录普通话语音,由37位说话人贡献了11,030条话语。数据格式为48kHz、16位单声道WAV文件及UTF-8编码的TXT文本,由MagicData版权所有,仅支持学术研究,禁止未经许可的商业使用。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务