FSDD
收藏arXiv2025-09-30 收录
下载链接:
https://github.com/jakobovski/free-spoken-digit-dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集专为说话人验证任务设计,能够从口语数字中识别说话人。在特征提取方面,该数据集使用了梅尔频率倒谱系数(MFCC)进行分类。所涉及的任务是说话人验证。
This dataset is specifically designed for speaker verification tasks, enabling speaker identification from spoken digits. In terms of feature extraction, Mel-Frequency Cepstral Coefficients (MFCC) are utilized for classification. The task involved is speaker verification.
搜集汇总
数据集介绍

背景与挑战
背景概述
FSDD(Free Spoken Digit Dataset)是一个开源的音频数据集,专注于口述数字的录音,包含6位说话者的3000条8kHz .wav文件,每个数字由每位说话者录制50次,录音已修剪以减少静音。该数据集适用于语音识别和机器学习任务,支持多种工具集成(如Hub、TensorFlow),并采用Creative Commons许可证鼓励贡献和使用。
以上内容由遇见数据集搜集并总结生成



