teticio/audio-diffusion-breaks-256
收藏Hugging Face2022-11-09 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/teticio/audio-diffusion-breaks-256
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含30,000个256x256的梅尔频谱图,这些频谱图是从WhoSampled和YouTube上获取的5秒音乐样本生成的。数据集的技术细节包括:x_res = 256,y_res = 256,sample_rate = 22050,n_fft = 2048,hop_length = 512。此外,还提供了从音频到频谱图的转换代码以及使用去噪扩散概率模型进行训练和推理的脚本。
提供机构:
teticio
原始信息汇总
数据集概述
基本信息
- 名称: Mel spectrograms of sampled music
- 大小: 10K<n<100K
- 语言: 未指定
- 多语言性: 未指定
- 许可证: 未指定
数据内容
- 类型: 音频
- 格式: 256x256 Mel 频谱图
- 样本数量: 30,000
- 样本时长: 5秒
- 来源: WhoSampled 和 YouTube
技术细节
- 分辨率: x_res = 256, y_res = 256
- 采样率: 22050 Hz
- FFT大小: 2048
- 跳跃长度: 512
任务相关
- 任务类别: image-to-image
- 任务ID: 未指定
附加资源
- 转换代码: 可用于音频到频谱图及反向转换的代码,位于 GitHub链接,包含训练和推理脚本。



