five

jamendo-fma-captions

收藏
魔搭社区2025-11-27 更新2025-05-24 收录
下载链接:
https://modelscope.cn/datasets/disco-eth/jamendo-fma-captions
下载链接
链接失效反馈
官方服务:
资源简介:
``` from datasets import load_dataset captions = load_dataset("disco-eth/jamendo-fma-captions") ``` # What is Jamendo-FMA-captions? This dataset contains synthetically generated captions for the MTG-Jamendo and the FMA dataset. We used SALMONN to caption both datasets and then improved the generated captions using ChatGPT. For more information or to cite our paper, see [Coarse-to-Fine Text-to-Music Latent Diffusion](https://openreview.net/forum?id=19Ukgqdlfg). ## Features - id: The sample id that can be used to match the caption to the respective audio. - 'dataset': Which dataset the caption belongs to, either Jamendo or FMA. - 'salmonn_text': The caption generated by SALMONN. - 'chatgpt_texts': A list containing one or more captions generated by ChatGPT. (this is the feature you're looking for) - 'tags_text': A textual description of the Jamendo tags for each sample.

from datasets import load_dataset captions = load_dataset("disco-eth/jamendo-fma-captions") # 何为Jamendo-FMA-captions数据集? 本数据集为MTG-Jamendo与FMA数据集提供合成生成的标注文本。 我们先使用SALMONN为两个数据集生成标注文本,随后借助ChatGPT对生成的标注文本进行优化。如需了解更多信息或引用我们的论文,请参阅《Coarse-to-Fine Text-to-Music Latent Diffusion》(链接:https://openreview.net/forum?id=19Ukgqdlfg)。 ## 字段说明 - id:样本ID,可用于将标注文本与对应的音频文件进行匹配。 - dataset:标注文本所属的数据集,可选值为Jamendo或FMA。 - salmonn_text:由SALMONN生成的标注文本。 - chatgpt_texts:包含一条或多条由ChatGPT生成的标注文本的列表(这正是您所需的字段)。 - tags_text:每个样本对应的Jamendo标签的文本描述。
提供机构:
maas
创建时间:
2025-05-21
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集为MTG-Jamendo和FMA音频数据集提供合成生成的字幕,通过SALMONN生成原始字幕并利用ChatGPT进行优化改进。数据集包含音频样本ID、来源数据集标识、原始字幕、优化后字幕列表以及标签文本描述,适用于音频字幕相关的研究和应用。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作