five

Speech_Commands

收藏
魔搭社区2025-10-15 更新2024-08-31 收录
下载链接:
https://modelscope.cn/datasets/OmniData/Speech_Commands
下载链接
链接失效反馈
官方服务:
资源简介:
displayName: Speech Commands labelTypes: - Classification license: - CC BY 4.0 mediaTypes: - Audio paperUrl: https://arxiv.org/pdf/1804.03209v1.pdf publishDate: "2017-08-03" publishUrl: https://ai.googleblog.com/2017/08/launching-speech-commands-dataset.html publisher: - Google AI Research tags: - Phrases - Speech taskTypes: - Audio Classification - Limited-Vocabulary Speech Recognition --- # 数据集介绍 ## 简介 语音命令是一个语音单词的音频数据集,旨在帮助训练和评估关键字识别系统。该数据集 (1.4 GB) 65,000了30个短词的一秒钟长话语,由数千个不同的人提供,由公众通过AIY网站提供。这是一套一秒的。wav音频文件,每个文件都包含一个口语单词。这些单词来自一小部分命令,并由各种不同的说话者说出。音频文件会根据它们包含的单词组织到文件夹中,并且此数据集旨在帮助训练简单的机器学习模型。 ## 引文 ``` @article{warden2018speech, title={Speech commands: A dataset for limited-vocabulary speech recognition}, author={Warden, Pete}, journal={arXiv preprint arXiv:1804.03209}, year={2018} } ``` ## Download dataset :modelscope-code[]{type="git"}

displayName: 语音命令(Speech Commands) labelTypes: - 分类(Classification) license: - 知识共享署名4.0(CC BY 4.0) mediaTypes: - 音频(Audio) paperUrl: https://arxiv.org/pdf/1804.03209v1.pdf publishDate: "2017年8月3日" publishUrl: https://ai.googleblog.com/2017/08/launching-speech-commands-dataset.html publisher: - 谷歌人工智能研究院(Google AI Research) tags: - 短语(Phrases) - 语音(Speech) taskTypes: - 音频分类(Audio Classification) - 有限词汇语音识别(Limited-Vocabulary Speech Recognition) --- # 数据集介绍 ## 简介 语音命令(Speech Commands)是一款用于辅助训练与评估关键词识别系统的语音单词音频数据集。该数据集总容量达1.4 GB,包含65000条时长为1秒的30个短词语音片段,由数千名不同发音者通过AIY网站公开录制并贡献。所有数据均为.wav格式音频文件,每条文件对应一条口语单词。所用词汇均为少量预设命令词,且由各类不同说话者录制。音频文件按其所包含的单词分类存放至对应文件夹,本数据集旨在辅助简单机器学习模型的训练。 ## 引文 @article{warden2018speech, title={Speech commands: A dataset for limited-vocabulary speech recognition}, author={Warden, Pete}, journal={arXiv preprint arXiv:1804.03209}, year={2018} } ## 下载数据集 :modelscope-code[]{type="git"}
提供机构:
maas
创建时间:
2024-07-10
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作