MJN和MedleyDB
收藏arXiv2025-03-05 更新2025-03-07 收录
下载链接:
https://github.com/Sonata165/LeadInstrumentDetection
下载链接
链接失效反馈官方服务:
资源简介:
本文创建了两个专家注释的数据集MJN和MedleyDB,用于引领乐器检测任务。这两个数据集包含多轨音乐录音,每轨都是时间同步的、来自不同乐器的音频。数据集由专家使用Adobe Audition进行注释,标注了起始、结束和乐器类型。数据集具有长尾分布的引领乐器类型,其中人声是最常见的引领乐器。MJN数据集使用常见的舞台开放式麦克风,含有大量的声音泄露。MedleyDB数据集包含了更多种类的乐器。这些数据集用于训练和评估新型神经网络模型,在多轨音乐设置中进行引领乐器检测。
This paper introduces two expert-annotated datasets, MJN and MedleyDB, tailored for leading instrument detection tasks. Both datasets comprise multi-track music recordings, where each track holds time-synchronized audio from distinct musical instruments. These datasets were annotated by experts via Adobe Audition, with labels including onset time, offset time, and instrument category. The leading instrument categories across the datasets follow a long-tail distribution, with human voice being the most prevalent one. The MJN dataset was captured using standard stage open microphones and contains substantial audio leakage. The MedleyDB dataset includes a broader variety of musical instruments. These datasets are utilized for training and evaluating novel neural network models for leading instrument detection in multi-track music settings.
提供机构:
新加坡国立大学 computing学院, 雅马哈公司研发部
创建时间:
2025-03-05
搜集汇总
数据集介绍

构建方式
本文构建了两个专家注释的数据集MJN和MedleyDB,包含多轨音乐录音,通过时间同步的方式组织,每轨包含不同乐器的音频。数据集的构建旨在支持多轨音乐中 lead instrument 检测任务的研究。
使用方法
使用该数据集的方法包括:首先对数据集进行预处理,包括音频标准化、转换和分段;然后使用数据集进行模型训练和测试,通过调整模型结构和参数来优化性能;最后在新的音乐片段上应用训练好的模型进行 lead instrument 检测。
背景与挑战
背景概述
MJN和MedleyDB数据集的研究背景源于音频内容分析领域,专注于识别多轨音乐中的主导乐器。该任务对于音乐结构分析和音频混音工作流程具有重要意义。MJN数据集包含现场演出的多轨录音,而MedleyDB则是一个广泛应用于音乐信息检索任务的数据集。研究人员Ou Longshen等提出了一个结合自监督学习模型和注意力机制的新型框架,以应对多轨音频输入的挑战,并创建了两个专家注释的数据集,为该任务提供了基础。
当前挑战
该数据集相关的挑战包括:1) 多轨音乐中的主导乐器识别任务尚未有现成解决方案,需要创新的方法来处理多轨音频输入;2) 构建过程中遇到的挑战包括如何有效集成自监督学习模型,设计合适的注意力机制以提取和聚合多轨信息;3) 需要大量专家注释的多轨音乐数据集来训练和验证模型。
常用场景
经典使用场景
MJN和MedleyDB数据集的经典使用场景在于自动化音乐内容分析,特别是针对多轨音乐音频中的主奏乐器检测任务。该数据集通过专家标注,提供了丰富的乐器类型和曲目变化,使得研究人员可以在此基础上训练和评估各种音乐分析模型,进而实现对多轨音乐中主奏乐器的精准识别。
解决学术问题
该数据集解决了传统音乐分析中仅针对单轨音频或混合音频进行分析的局限性,无法捕捉到乐器间的交互和角色特征的问题。通过引入多轨音频分析,数据集使得研究人员能够训练出可以识别不同乐器类型和组合下的主奏乐器的模型,提高了音乐分析任务的泛化能力和准确度。
实际应用
在实际应用中,该数据集可以应用于音乐推荐系统、音频缩略图生成、音乐结构分析以及音频混音工作流中。通过识别出多轨音乐中的主奏乐器,可以提升这些应用场景中的用户体验和系统智能程度。
数据集最近研究
最新研究方向
本文提出了针对多轨音乐音频中领奏乐器检测的任务,创建了两套专家注释的数据集,并设计了一种新颖的框架,该框架集成了自监督学习模型和基于注意力的分类器。研究的主要贡献包括:启动了多轨音乐中领奏乐器检测的任务,并提供了专家注释的数据集;提出的模型在多个设置中表现出优于现有SVM和CRNN模型的性能,并且能够推广到未见过的乐器和新领域。
相关研究论文
- 1Lead Instrument Detection from Multitrack Music新加坡国立大学 computing学院, 雅马哈公司研发部 · 2025年
以上内容由遇见数据集搜集并总结生成



