teticio/audio-diffusion-256
收藏Hugging Face2022-11-09 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/teticio/audio-diffusion-256
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含超过20,000个256x256的梅尔频谱图,这些频谱图是从Spotify喜欢的播放列表中提取的5秒音乐样本生成的。数据集适用于图像到图像的任务类别,主要用于音频处理领域。
提供机构:
teticio
原始信息汇总
数据集概述
基本信息
- 名称: Mel spectrograms of music
- 大小: 10K<n<100K
- 语言: 未指定
- 许可证: 未指定
- 多语言性: 未指定
数据内容
- 类型: 音频
- 格式: 256x256 Mel spectrograms
- 样本时长: 5秒
- 样本数量: 超过20,000个
技术细节
- 分辨率: x_res = 256, y_res = 256
- 采样率: 22050 Hz
- FFT大小: 2048
- 跳跃长度: 512
任务相关
- 任务类别: image-to-image
- 任务ID: 未指定
附加信息
- 数据转换代码: 可在GitHub链接找到音频到频谱图及反向转换的代码,以及使用去噪扩散概率模型的训练和推理脚本。



