five

teticio/audio-diffusion-breaks-256

收藏
Hugging Face2022-11-09 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/teticio/audio-diffusion-breaks-256
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含30,000个256x256的梅尔频谱图,这些频谱图是从WhoSampled和YouTube上获取的5秒音乐样本生成的。数据集的技术细节包括:x_res = 256,y_res = 256,sample_rate = 22050,n_fft = 2048,hop_length = 512。此外,还提供了从音频到频谱图的转换代码以及使用去噪扩散概率模型进行训练和推理的脚本。
提供机构:
teticio
原始信息汇总

数据集概述

基本信息

  • 名称: Mel spectrograms of sampled music
  • 大小: 10K<n<100K
  • 语言: 未指定
  • 多语言性: 未指定
  • 许可证: 未指定

数据内容

  • 类型: 音频
  • 格式: 256x256 Mel 频谱图
  • 样本数量: 30,000
  • 样本时长: 5秒
  • 来源: WhoSampledYouTube

技术细节

  • 分辨率: x_res = 256, y_res = 256
  • 采样率: 22050 Hz
  • FFT大小: 2048
  • 跳跃长度: 512

任务相关

  • 任务类别: image-to-image
  • 任务ID: 未指定

附加资源

  • 转换代码: 可用于音频到频谱图及反向转换的代码,位于 GitHub链接,包含训练和推理脚本。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作