MTG-Jamendo Dataset

github2024-05-22 更新2024-05-31 收录

下载链接：

https://github.com/MTG/mtg-jamendo-dataset

下载链接

链接失效反馈

官方服务：

资源简介：

我们提供了一个新的开放音乐自动标记数据集MTG-Jamendo，该数据集使用Jamendo上基于Creative Commons许可证的音乐和内容上传者提供的标签构建。数据集包含超过55,000个完整音频曲目，涵盖195个来自流派、乐器和情绪/主题类别的标签。

We present a novel open music auto-tagging dataset, MTG-Jamendo, constructed using music from Jamendo under Creative Commons licenses and tags provided by content uploaders. The dataset encompasses over 55,000 full-length audio tracks, covering 195 tags from genres, instruments, and mood/theme categories.

创建时间：

2019-04-25

原始信息汇总

MTG-Jamendo Dataset 概述

数据集描述

名称: MTG-Jamendo Dataset
目的: 用于音乐自动标记的新开放数据集
数据来源: 使用Jamendo上的音乐，遵循创意共享许可证
数据内容: 包含超过55,000个完整音频曲目，带有195个来自流派、乐器和情绪/主题类别的标签
数据分割: 提供详细的数据分割，适用于研究者
基准性能: 报告了在五种不同标签集（流派、乐器、情绪/主题、前50名、总体）上的简单基线方法性能

数据集结构

元数据文件: 位于data目录下，包括原始数据、清理后的标签数据及特定艺术家的标签数据等
统计数据: 位于stats目录下，提供每个元数据文件的统计信息

使用数据集

要求: Python 3.7+
数据下载: 音频以320kbps MP3格式分发，也提供低比特率版本和预计算的mel-spectrograms
数据加载: 提供Python脚本用于加载数据
数据处理与统计: 提供脚本用于重新计算统计数据和清理标签

数据集子集

子集创建: 提供脚本用于创建仅包含前50个标签或特定类别（如情绪/主题）的子集
数据分割: 提供训练/验证/测试集的分割

实验重现

预处理: 提供脚本用于预处理数据
训练与测试: 提供脚本用于训练和测试模型

研究挑战

数据集被用于MediaEval 2019-2021年的情感和主题识别音乐任务

引用信息

引用文献: Bogdanov, D., et al. (2019). The MTG-Jamendo Dataset for Automatic Music Tagging.

许可证

代码: Apache 2.0
元数据: CC BY-NC-SA 4.0
音频文件: 创意共享许可证，具体细节见audio_licenses.txt

致谢

本工作由多个基金项目资助，包括西班牙经济和竞争力部及欧洲联盟的Horizon 2020研究与创新计划。

搜集汇总

数据集介绍

构建方式

MTG-Jamendo数据集的构建基于Jamendo平台上提供的Creative Commons许可音乐，利用上传者提供的标签信息。该数据集包含超过55,000首完整音频曲目，涵盖195个标签，分为音乐流派、乐器和情绪/主题三大类别。数据集的构建过程中，首先对原始数据进行预处理，筛选出时长超过30秒的曲目，并根据标签映射文件合并标签。随后，过滤掉标签数量少于50个独特艺术家的曲目，最终形成用于自动标签任务的基础文件。此外，数据集还提供了详细的训练/验证/测试集划分，确保研究者在不同标签集上的实验可重复性。

特点

MTG-Jamendo数据集的显著特点在于其大规模和多样性。数据集包含超过55,000首曲目，覆盖195个标签，涵盖音乐流派、乐器和情绪/主题等多个维度。此外，数据集提供了多种预处理和子集划分，如仅包含前50个最常用标签的子集、仅包含流派标签的子集等，便于研究者在不同场景下进行实验。数据集还提供了预计算的Mel频谱图和统计特征，进一步简化了数据处理流程。

使用方法

使用MTG-Jamendo数据集时，首先需要下载数据集的元数据和音频文件。数据集提供了多种下载选项，包括高音质和低音质的音频文件，以及预计算的Mel频谱图和统计特征。下载完成后，用户可以通过提供的Python脚本加载数据，并进行进一步的预处理和实验。数据集还提供了详细的实验复现指南，包括如何重新计算统计数据、如何创建子集以及如何复现基准实验结果。此外，数据集的元数据文件包含了艺术家、专辑名称、曲目标题等额外信息，有助于进行更深入的分析和研究。

背景与挑战

背景概述

音乐自动标签化是音乐信息检索领域的一个重要研究方向，旨在通过机器学习技术自动为音乐作品分配标签，以辅助音乐分类、推荐和搜索。MTG-Jamendo数据集由Music Technology Group（MTG）创建，于2019年发布，旨在为音乐自动标签化研究提供一个开放且丰富的数据资源。该数据集包含了超过55,000首完整的音频曲目，涵盖了195个标签，涉及音乐的流派、乐器和情绪/主题等多个类别。MTG-Jamendo数据集的发布不仅为研究人员提供了一个标准化的测试平台，还推动了音乐信息检索技术的发展，特别是在多标签分类和情感识别方面。

当前挑战

MTG-Jamendo数据集在构建过程中面临了多个挑战。首先，数据集的标签来源于Jamendo平台的内容上传者，这导致了标签的多样性和不一致性，增加了数据预处理的复杂性。其次，音频数据的多样性，包括不同流派、乐器和情绪的音乐，使得模型训练需要处理高度异质的数据。此外，数据集的规模庞大，下载和处理这些数据对计算资源和存储空间提出了高要求。最后，如何有效地划分数据集以确保训练、验证和测试集的独立性和代表性，也是一个重要的挑战。这些挑战不仅影响了数据集的构建，也对后续的研究和模型训练提出了更高的要求。

常用场景

经典使用场景

在音乐自动标签领域，MTG-Jamendo数据集以其丰富的音频资源和详尽的标签信息，成为研究者们进行音乐分类、情感识别和主题分析的经典工具。该数据集包含了超过55,000首完整的音频曲目，涵盖了195个标签，涉及音乐的流派、乐器和情感主题等多个维度。通过这些数据，研究者可以训练和验证各种音乐自动标签模型，从而提升音乐信息检索和推荐系统的性能。

解决学术问题

MTG-Jamendo数据集在学术研究中解决了音乐自动标签这一核心问题，为研究者提供了一个标准化的数据平台，用于探索和验证音乐特征提取、分类算法和情感识别技术。该数据集的引入，不仅推动了音乐信息学领域的发展，还为跨学科研究如心理学和神经科学提供了宝贵的数据资源，有助于揭示音乐与人类情感和认知之间的复杂关系。

衍生相关工作

基于MTG-Jamendo数据集，研究者们开展了一系列相关工作，包括音乐情感和主题识别任务、音乐分类注释和歌曲描述生成等。例如，MediaEval 2019-2021系列任务中，该数据集被用于评估音乐情感和主题识别模型的性能。此外，Song Describer数据集的构建也受益于MTG-Jamendo，进一步推动了音乐与语言交叉领域的研究。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集