jamendo-fma-captions
收藏魔搭社区2025-11-27 更新2025-05-24 收录
下载链接:
https://modelscope.cn/datasets/disco-eth/jamendo-fma-captions
下载链接
链接失效反馈官方服务:
资源简介:
```
from datasets import load_dataset
captions = load_dataset("disco-eth/jamendo-fma-captions")
```
# What is Jamendo-FMA-captions?
This dataset contains synthetically generated captions for the MTG-Jamendo and the FMA dataset.
We used SALMONN to caption both datasets and then improved the generated captions using ChatGPT. For more information or to cite our paper, see [Coarse-to-Fine Text-to-Music Latent Diffusion](https://openreview.net/forum?id=19Ukgqdlfg).
## Features
- id: The sample id that can be used to match the caption to the respective audio.
- 'dataset': Which dataset the caption belongs to, either Jamendo or FMA.
- 'salmonn_text': The caption generated by SALMONN.
- 'chatgpt_texts': A list containing one or more captions generated by ChatGPT. (this is the feature you're looking for)
- 'tags_text': A textual description of the Jamendo tags for each sample.
from datasets import load_dataset
captions = load_dataset("disco-eth/jamendo-fma-captions")
# 何为Jamendo-FMA-captions数据集?
本数据集为MTG-Jamendo与FMA数据集提供合成生成的标注文本。
我们先使用SALMONN为两个数据集生成标注文本,随后借助ChatGPT对生成的标注文本进行优化。如需了解更多信息或引用我们的论文,请参阅《Coarse-to-Fine Text-to-Music Latent Diffusion》(链接:https://openreview.net/forum?id=19Ukgqdlfg)。
## 字段说明
- id:样本ID,可用于将标注文本与对应的音频文件进行匹配。
- dataset:标注文本所属的数据集,可选值为Jamendo或FMA。
- salmonn_text:由SALMONN生成的标注文本。
- chatgpt_texts:包含一条或多条由ChatGPT生成的标注文本的列表(这正是您所需的字段)。
- tags_text:每个样本对应的Jamendo标签的文本描述。
提供机构:
maas
创建时间:
2025-05-21
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集为MTG-Jamendo和FMA音频数据集提供合成生成的字幕,通过SALMONN生成原始字幕并利用ChatGPT进行优化改进。数据集包含音频样本ID、来源数据集标识、原始字幕、优化后字幕列表以及标签文本描述,适用于音频字幕相关的研究和应用。
以上内容由遇见数据集搜集并总结生成



