MTG-Jamendo Dataset
收藏github2024-05-22 更新2024-05-31 收录
下载链接:
https://github.com/MTG/mtg-jamendo-dataset
下载链接
链接失效反馈官方服务:
资源简介:
我们提供了一个新的开放音乐自动标记数据集MTG-Jamendo,该数据集使用Jamendo上基于Creative Commons许可证的音乐和内容上传者提供的标签构建。数据集包含超过55,000个完整音频曲目,涵盖195个来自流派、乐器和情绪/主题类别的标签。
We present a novel open music auto-tagging dataset, MTG-Jamendo, constructed using music from Jamendo under Creative Commons licenses and tags provided by content uploaders. The dataset encompasses over 55,000 full-length audio tracks, covering 195 tags from genres, instruments, and mood/theme categories.
创建时间:
2019-04-25
原始信息汇总
MTG-Jamendo Dataset 概述
数据集描述
- 名称: MTG-Jamendo Dataset
- 目的: 用于音乐自动标记的新开放数据集
- 数据来源: 使用Jamendo上的音乐,遵循创意共享许可证
- 数据内容: 包含超过55,000个完整音频曲目,带有195个来自流派、乐器和情绪/主题类别的标签
- 数据分割: 提供详细的数据分割,适用于研究者
- 基准性能: 报告了在五种不同标签集(流派、乐器、情绪/主题、前50名、总体)上的简单基线方法性能
数据集结构
- 元数据文件: 位于
data目录下,包括原始数据、清理后的标签数据及特定艺术家的标签数据等 - 统计数据: 位于
stats目录下,提供每个元数据文件的统计信息
使用数据集
- 要求: Python 3.7+
- 数据下载: 音频以320kbps MP3格式分发,也提供低比特率版本和预计算的mel-spectrograms
- 数据加载: 提供Python脚本用于加载数据
- 数据处理与统计: 提供脚本用于重新计算统计数据和清理标签
数据集子集
- 子集创建: 提供脚本用于创建仅包含前50个标签或特定类别(如情绪/主题)的子集
- 数据分割: 提供训练/验证/测试集的分割
实验重现
- 预处理: 提供脚本用于预处理数据
- 训练与测试: 提供脚本用于训练和测试模型
相关数据集
- 音乐分类注释: 包含根据15个现有音乐分类数据集的注释
- 歌曲描述器数据集: 包含约1.1k个描述706个音乐录音的标题,适用于音乐与语言任务的评估
研究挑战
- 数据集被用于MediaEval 2019-2021年的情感和主题识别音乐任务
引用信息
- 引用文献: Bogdanov, D., et al. (2019). The MTG-Jamendo Dataset for Automatic Music Tagging.
许可证
- 代码: Apache 2.0
- 元数据: CC BY-NC-SA 4.0
- 音频文件: 创意共享许可证,具体细节见
audio_licenses.txt
致谢
- 本工作由多个基金项目资助,包括西班牙经济和竞争力部及欧洲联盟的Horizon 2020研究与创新计划。
搜集汇总
数据集介绍

构建方式
MTG-Jamendo数据集的构建基于Jamendo平台上提供的Creative Commons许可音乐,利用上传者提供的标签信息。该数据集包含超过55,000首完整音频曲目,涵盖195个标签,分为音乐流派、乐器和情绪/主题三大类别。数据集的构建过程中,首先对原始数据进行预处理,筛选出时长超过30秒的曲目,并根据标签映射文件合并标签。随后,过滤掉标签数量少于50个独特艺术家的曲目,最终形成用于自动标签任务的基础文件。此外,数据集还提供了详细的训练/验证/测试集划分,确保研究者在不同标签集上的实验可重复性。
特点
MTG-Jamendo数据集的显著特点在于其大规模和多样性。数据集包含超过55,000首曲目,覆盖195个标签,涵盖音乐流派、乐器和情绪/主题等多个维度。此外,数据集提供了多种预处理和子集划分,如仅包含前50个最常用标签的子集、仅包含流派标签的子集等,便于研究者在不同场景下进行实验。数据集还提供了预计算的Mel频谱图和统计特征,进一步简化了数据处理流程。
使用方法
使用MTG-Jamendo数据集时,首先需要下载数据集的元数据和音频文件。数据集提供了多种下载选项,包括高音质和低音质的音频文件,以及预计算的Mel频谱图和统计特征。下载完成后,用户可以通过提供的Python脚本加载数据,并进行进一步的预处理和实验。数据集还提供了详细的实验复现指南,包括如何重新计算统计数据、如何创建子集以及如何复现基准实验结果。此外,数据集的元数据文件包含了艺术家、专辑名称、曲目标题等额外信息,有助于进行更深入的分析和研究。
背景与挑战
背景概述
音乐自动标签化是音乐信息检索领域的一个重要研究方向,旨在通过机器学习技术自动为音乐作品分配标签,以辅助音乐分类、推荐和搜索。MTG-Jamendo数据集由Music Technology Group(MTG)创建,于2019年发布,旨在为音乐自动标签化研究提供一个开放且丰富的数据资源。该数据集包含了超过55,000首完整的音频曲目,涵盖了195个标签,涉及音乐的流派、乐器和情绪/主题等多个类别。MTG-Jamendo数据集的发布不仅为研究人员提供了一个标准化的测试平台,还推动了音乐信息检索技术的发展,特别是在多标签分类和情感识别方面。
当前挑战
MTG-Jamendo数据集在构建过程中面临了多个挑战。首先,数据集的标签来源于Jamendo平台的内容上传者,这导致了标签的多样性和不一致性,增加了数据预处理的复杂性。其次,音频数据的多样性,包括不同流派、乐器和情绪的音乐,使得模型训练需要处理高度异质的数据。此外,数据集的规模庞大,下载和处理这些数据对计算资源和存储空间提出了高要求。最后,如何有效地划分数据集以确保训练、验证和测试集的独立性和代表性,也是一个重要的挑战。这些挑战不仅影响了数据集的构建,也对后续的研究和模型训练提出了更高的要求。
常用场景
经典使用场景
在音乐自动标签领域,MTG-Jamendo数据集以其丰富的音频资源和详尽的标签信息,成为研究者们进行音乐分类、情感识别和主题分析的经典工具。该数据集包含了超过55,000首完整的音频曲目,涵盖了195个标签,涉及音乐的流派、乐器和情感主题等多个维度。通过这些数据,研究者可以训练和验证各种音乐自动标签模型,从而提升音乐信息检索和推荐系统的性能。
解决学术问题
MTG-Jamendo数据集在学术研究中解决了音乐自动标签这一核心问题,为研究者提供了一个标准化的数据平台,用于探索和验证音乐特征提取、分类算法和情感识别技术。该数据集的引入,不仅推动了音乐信息学领域的发展,还为跨学科研究如心理学和神经科学提供了宝贵的数据资源,有助于揭示音乐与人类情感和认知之间的复杂关系。
衍生相关工作
基于MTG-Jamendo数据集,研究者们开展了一系列相关工作,包括音乐情感和主题识别任务、音乐分类注释和歌曲描述生成等。例如,MediaEval 2019-2021系列任务中,该数据集被用于评估音乐情感和主题识别模型的性能。此外,Song Describer数据集的构建也受益于MTG-Jamendo,进一步推动了音乐与语言交叉领域的研究。
以上内容由遇见数据集搜集并总结生成



