danjacobellis/MDCT-1k

Name: danjacobellis/MDCT-1k
Creator: danjacobellis
Published: 2023-08-14 03:07:47
License: 暂无描述

Hugging Face2023-08-14 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/danjacobellis/MDCT-1k

下载链接

链接失效反馈

官方服务：

资源简介：

MDCT-1k数据集包含超过1000个音频片段，这些片段来自Google音乐字幕数据集，并以512x512的时间-频率图像表示。这些时间-频率图像是从20秒音频片段的0-12kHz频带的MDCT系数生成的。与其他音频扩散模型不同，MDCT空间不需要使用声码器，也不会对任何频率范围进行过采样或欠采样。

提供机构：

danjacobellis

原始信息汇总

数据集概述

数据集名称

MDCT-1k

数据集特征

image: 图像数据类型
text: 字符串数据类型

数据集分割

train:
- 示例数量: 1581
- 数据大小: 378108023.375字节
- 下载大小: 373552088字节

数据集描述

数据集包含超过1000个来自Google音乐字幕数据集的音频片段，这些片段被表示为512x512的时间-频率图像。这些图像是由20秒音频片段的MDCT系数在0-12kHz频率带宽内创建的。

5,000+

优质数据集

54 个

任务类型

进入经典数据集