speech_commands
收藏Opencsg2024-07-19 更新2025-05-03 收录
下载链接:
https://www.opencsg.com/datasets/google/speech_commands
下载链接
链接失效反馈官方服务:
资源简介:
SpeechCommands是一个英文语音数据集,主要用于训练和评估关键词识别系统。它包含超过10万个一秒钟的.wav音频文件,每个文件包含一个由不同说话人说的英文单词或背景噪声。数据集提供两种版本,分别包含不同数量的单词,并标注了音频文件、音频数组、采样率、标签(单词或背景噪声)、是否为辅助词、说话人ID和发音ID等信息。这些数据通过众包方式采集,旨在帮助构建能够检测目标词汇并区分背景噪声或无关语音的小型模型,并采用CC-BY 4.0协议授权。
创建时间:
2024-07-19



