AudioMNIST
收藏OpenDataLab2026-05-17 更新2024-05-09 收录
下载链接:
https://opendatalab.org.cn/OpenDataLab/AudioMNIST
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含来自60个不同扬声器的30,000个语音数字 (0-9) 的音频样本。
每个演讲者都有一个目录来保存录音。
此外,“audioMNIST_meta.txt” 提供了元信息,例如每个说话者的性别或年龄。
This dataset contains 30,000 audio samples of spoken digits (0-9) from 60 distinct speakers. Each speaker has a dedicated directory to store their recorded audio. Additionally, the file "audioMNIST_meta.txt" provides meta-information such as the gender and age of each speaker.
提供机构:
OpenDataLab
创建时间:
2023-04-20
搜集汇总
数据集介绍

背景与挑战
背景概述
AudioMNIST是一个语音数字识别数据集,包含30,000个0-9数字的音频样本,由60位不同说话者录制,并附带说话者性别、年龄等元信息。该数据集由柏林工业大学、马克斯普朗克信息学研究所和高丽大学于2018年发布,适用于语音处理和机器学习研究。
以上内容由遇见数据集搜集并总结生成



