five

FSDD

收藏
arXiv2025-09-30 收录
下载链接:
https://github.com/jakobovski/free-spoken-digit-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集专为说话人验证任务设计,能够从口语数字中识别说话人。在特征提取方面,该数据集使用了梅尔频率倒谱系数(MFCC)进行分类。所涉及的任务是说话人验证。

This dataset is specifically designed for speaker verification tasks, enabling speaker identification from spoken digits. In terms of feature extraction, Mel-Frequency Cepstral Coefficients (MFCC) are utilized for classification. The task involved is speaker verification.
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
FSDD(Free Spoken Digit Dataset)是一个开源的音频数据集,专注于口述数字的录音,包含6位说话者的3000条8kHz .wav文件,每个数字由每位说话者录制50次,录音已修剪以减少静音。该数据集适用于语音识别和机器学习任务,支持多种工具集成(如Hub、TensorFlow),并采用Creative Commons许可证鼓励贡献和使用。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作