vucinatim/spectrogram-captions

Name: vucinatim/spectrogram-captions
Creator: vucinatim
Published: 2023-01-03 00:24:32
License: 暂无描述

Hugging Face2023-01-03 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/vucinatim/spectrogram-captions

下载链接

链接失效反馈

官方服务：

资源简介：

--- annotations_creators: - machine-generated language: - en language_creators: - machine-generated license: - afl-3.0 multilinguality: - monolingual pretty_name: Captioned generic audio clips with spectrogram images size_categories: - n<1K source_datasets: [] tags: - 'stable diffusion sound generation text-to-sound text-to-image-to-sound spectrogram' task_categories: - text-to-image task_ids: [] --- Dataset of captioned spectrograms (text describing the sound).

提供机构：

vucinatim

原始信息汇总

数据集概述

基本信息

名称: Captioned generic audio clips with spectrogram images
语言: 英语（en）
语言生成方式: 机器生成
许可证: AFL-3.0
多语言性: 单语种
数据集大小: 小于1000条记录

内容描述

数据类型: 包含标题的频谱图（描述声音的文本）

应用领域

任务类别: 文本到图像生成
相关技术标签:
- 稳定扩散声音生成
- 文本到声音
- 文本到图像到声音
- 频谱图

5,000+

优质数据集

54 个

任务类型

进入经典数据集