Speech_Commands
收藏魔搭社区2025-10-15 更新2024-08-31 收录
下载链接:
https://modelscope.cn/datasets/OmniData/Speech_Commands
下载链接
链接失效反馈官方服务:
资源简介:
displayName: Speech Commands
labelTypes:
- Classification
license:
- CC BY 4.0
mediaTypes:
- Audio
paperUrl: https://arxiv.org/pdf/1804.03209v1.pdf
publishDate: "2017-08-03"
publishUrl: https://ai.googleblog.com/2017/08/launching-speech-commands-dataset.html
publisher:
- Google AI Research
tags:
- Phrases
- Speech
taskTypes:
- Audio Classification
- Limited-Vocabulary Speech Recognition
---
# 数据集介绍
## 简介
语音命令是一个语音单词的音频数据集,旨在帮助训练和评估关键字识别系统。该数据集 (1.4 GB) 65,000了30个短词的一秒钟长话语,由数千个不同的人提供,由公众通过AIY网站提供。这是一套一秒的。wav音频文件,每个文件都包含一个口语单词。这些单词来自一小部分命令,并由各种不同的说话者说出。音频文件会根据它们包含的单词组织到文件夹中,并且此数据集旨在帮助训练简单的机器学习模型。
## 引文
```
@article{warden2018speech,
title={Speech commands: A dataset for limited-vocabulary speech recognition},
author={Warden, Pete},
journal={arXiv preprint arXiv:1804.03209},
year={2018}
}
```
## Download dataset
:modelscope-code[]{type="git"}
displayName: 语音命令(Speech Commands)
labelTypes:
- 分类(Classification)
license:
- 知识共享署名4.0(CC BY 4.0)
mediaTypes:
- 音频(Audio)
paperUrl: https://arxiv.org/pdf/1804.03209v1.pdf
publishDate: "2017年8月3日"
publishUrl: https://ai.googleblog.com/2017/08/launching-speech-commands-dataset.html
publisher:
- 谷歌人工智能研究院(Google AI Research)
tags:
- 短语(Phrases)
- 语音(Speech)
taskTypes:
- 音频分类(Audio Classification)
- 有限词汇语音识别(Limited-Vocabulary Speech Recognition)
---
# 数据集介绍
## 简介
语音命令(Speech Commands)是一款用于辅助训练与评估关键词识别系统的语音单词音频数据集。该数据集总容量达1.4 GB,包含65000条时长为1秒的30个短词语音片段,由数千名不同发音者通过AIY网站公开录制并贡献。所有数据均为.wav格式音频文件,每条文件对应一条口语单词。所用词汇均为少量预设命令词,且由各类不同说话者录制。音频文件按其所包含的单词分类存放至对应文件夹,本数据集旨在辅助简单机器学习模型的训练。
## 引文
@article{warden2018speech,
title={Speech commands: A dataset for limited-vocabulary speech recognition},
author={Warden, Pete},
journal={arXiv preprint arXiv:1804.03209},
year={2018}
}
## 下载数据集
:modelscope-code[]{type="git"}
提供机构:
maas
创建时间:
2024-07-10



