five

AdoCleanCode/consolidated_dac_denoising_dataset_GOOD_4_1_batch_1

收藏
Hugging Face2025-09-13 更新2025-10-25 收录
下载链接:
https://hf-mirror.com/datasets/AdoCleanCode/consolidated_dac_denoising_dataset_GOOD_4_1_batch_1
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个包含语音数据的 dataset,其中包括说话人ID(utt_id)、语音时长(duration)、噪声类型(noise_type)、原始文件名(original_file)、原始采样率(original_sr)和语音序列(sequence)等信息。数据集分为训练集,共有200,000个样本,总大小为8,948,949,832字节。提供了默认配置,指定了训练集的数据文件路径。

This is a dataset containing speech data, including speaker ID (utt_id), speech duration (duration), noise type (noise_type), original filename (original_file), original sampling rate (original_sr), and speech sequence (sequence). The dataset is split into a training set with a total of 200,000 samples, totaling 8,948,949,832 bytes. A default configuration is provided, specifying the path to the data files for the training set.
提供机构:
AdoCleanCode
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作