FSDD

arXiv2025-09-30 收录

下载链接：

https://github.com/jakobovski/free-spoken-digit-dataset

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集专为说话人验证任务设计，能够从口语数字中识别说话人。在特征提取方面，该数据集使用了梅尔频率倒谱系数（MFCC）进行分类。所涉及的任务是说话人验证。

This dataset is specifically designed for speaker verification tasks, enabling speaker identification from spoken digits. In terms of feature extraction, Mel-Frequency Cepstral Coefficients (MFCC) are utilized for classification. The task involved is speaker verification.

搜集汇总

数据集介绍

背景与挑战

背景概述

FSDD（Free Spoken Digit Dataset）是一个开源的音频数据集，专注于口述数字的录音，包含6位说话者的3000条8kHz .wav文件，每个数字由每位说话者录制50次，录音已修剪以减少静音。该数据集适用于语音识别和机器学习任务，支持多种工具集成（如Hub、TensorFlow），并采用Creative Commons许可证鼓励贡献和使用。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集