vucinatim/spectrogram-captions
收藏Hugging Face2023-01-03 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/vucinatim/spectrogram-captions
下载链接
链接失效反馈官方服务:
资源简介:
---
annotations_creators:
- machine-generated
language:
- en
language_creators:
- machine-generated
license:
- afl-3.0
multilinguality:
- monolingual
pretty_name: Captioned generic audio clips with spectrogram images
size_categories:
- n<1K
source_datasets: []
tags:
- 'stable diffusion sound generation
text-to-sound
text-to-image-to-sound
spectrogram'
task_categories:
- text-to-image
task_ids: []
---
Dataset of captioned spectrograms (text describing the sound).
提供机构:
vucinatim
原始信息汇总
数据集概述
基本信息
- 名称: Captioned generic audio clips with spectrogram images
- 语言: 英语(en)
- 语言生成方式: 机器生成
- 许可证: AFL-3.0
- 多语言性: 单语种
- 数据集大小: 小于1000条记录
内容描述
- 数据类型: 包含标题的频谱图(描述声音的文本)
应用领域
- 任务类别: 文本到图像生成
- 相关技术标签:
- 稳定扩散声音生成
- 文本到声音
- 文本到图像到声音
- 频谱图



