Google Speech Commands - Musan
收藏OpenDataLab2026-05-24 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/Google_Speech_Commands-Musan
下载链接
链接失效反馈官方服务:
资源简介:
这个嘈杂的语音测试集是根据 Google Speech Commands v2 [1] 和 Musan 数据集 [2] 创建的。它在我们的 ICASSP 2022 论文 [3] 中进行了介绍。
具体来说,我们通过将 Google Speech Commands v2 测试集中的语音与 Musan 数据集中的随机噪声以不同的信噪比 -12.5、-10、0、10、20、30 和 40 分贝(dB )。
This noisy speech test set was created based on Google Speech Commands v2 [1] and Musan dataset [2], and was introduced in our ICASSP 2022 paper [3]. Specifically, we mixed the speech from the Google Speech Commands v2 test set with random noises from the Musan dataset at various signal-to-noise ratios (SNR) of -12.5, -10, 0, 10, 20, 30 and 40 decibels (dB).
提供机构:
OpenDataLab
创建时间:
2022-09-01
搜集汇总
数据集介绍

背景与挑战
背景概述
Google Speech Commands - Musan是一个用于语音识别和关键字定位的嘈杂语音测试集,基于Google Speech Commands v2和Musan数据集创建,包含不同信噪比的语音和噪声混合样本。该数据集在ICASSP 2022论文中介绍,主要用于增强语音识别的鲁棒性研究。
以上内容由遇见数据集搜集并总结生成



