Free Spoken Digit Dataset (FSDD) 数字识别音频数据集

超神经2024-08-02 更新2024-12-14 收录

下载链接：

https://hyper.ai/cn/datasets/33094

下载链接

链接失效反馈

官方服务：

资源简介：

Free Spoken Digit Dataset (FSDD) 是一个简单的音频/语音数据集，由 8kHz 采样率的 wav 文件中的数字语音录音组成。这些录音经过裁剪，以尽量减少开头和结尾的沉默时间。数据集是开放的，意味着随着数据的不断贡献，它会随着时间增长。

Free Spoken Digit Dataset (FSDD) is a simple audio/speech dataset consisting of spoken digit recordings stored as WAV files with an 8 kHz sampling rate. These recordings have been trimmed to minimize silent intervals at both the beginning and end. The dataset is open and will grow over time as more contributions are made to it.

创建时间：

2024-07-30

搜集汇总

数据集介绍

背景与挑战

背景概述

Free Spoken Digit Dataset (FSDD) 是一个用于数字识别的开源音频数据集，包含6位演讲者录制的3000条英语数字发音录音，采样率为8kHz，以wav格式存储并裁剪了沉默部分。该数据集采用标准命名格式，支持社区持续贡献，适用于音频分类等研究场景。

以上内容由遇见数据集搜集并总结生成