teticio/audio-diffusion-breaks-256

Name: teticio/audio-diffusion-breaks-256
Creator: teticio
Published: 2022-11-09 10:50:38
License: 暂无描述

Hugging Face2022-11-09 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/teticio/audio-diffusion-breaks-256

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含30,000个256x256的梅尔频谱图，这些频谱图是从WhoSampled和YouTube上获取的5秒音乐样本生成的。数据集的技术细节包括：x_res = 256，y_res = 256，sample_rate = 22050，n_fft = 2048，hop_length = 512。此外，还提供了从音频到频谱图的转换代码以及使用去噪扩散概率模型进行训练和推理的脚本。

提供机构：

teticio

原始信息汇总

数据集概述

基本信息

名称: Mel spectrograms of sampled music
大小: 10K<n<100K
语言: 未指定
多语言性: 未指定
许可证: 未指定

数据内容

类型: 音频
格式: 256x256 Mel 频谱图
样本数量: 30,000
样本时长: 5秒
来源: WhoSampled 和 YouTube

技术细节

分辨率: x_res = 256, y_res = 256
采样率: 22050 Hz
FFT大小: 2048
跳跃长度: 512

任务相关

任务类别: image-to-image
任务ID: 未指定

附加资源

转换代码: 可用于音频到频谱图及反向转换的代码，位于 GitHub链接，包含训练和推理脚本。

5,000+

优质数据集

54 个

任务类型

进入经典数据集