MSRBench

Name: MSRBench
Creator: John Hopkins University, The Chinese University of Hong Kong, Sony AI, King's College London
Published: 2025-10-13 12:12:55
License: 暂无描述

arXiv2025-10-13 更新2025-10-15 收录

下载链接：

https://msrchallenge.com/

下载链接

链接失效反馈

官方服务：

资源简介：

MSRBench是一个为音乐源恢复（MSR）评估而设计的基准数据集，包含了2000个由专业混音工程师制作的原始音轨-混合音轨对，涵盖了八个乐器类别。数据集还包含了12种真实世界的降级类型，包括模拟/声学效果、传统编解码器和神经编解码器。该数据集旨在解决现有基准数据集无法准确测量恢复保真度的问题，并为音乐源恢复领域的研究提供了标准化的评估平台。

MSRBench is a benchmark dataset developed for music source recovery (MSR) evaluation. It contains 2000 raw track-mixed track pairs produced by professional mixing engineers, covering eight instrument categories. The dataset also includes 12 real-world degradation types, including simulated/acoustic effects, traditional codecs and neural codecs. This dataset aims to solve the problem that existing benchmark datasets cannot accurately measure recovery fidelity, and provides a standardized evaluation platform for research in the field of music source recovery.

提供机构：

John Hopkins University, The Chinese University of Hong Kong, Sony AI, King's College London

创建时间：

2025-10-13

原始信息汇总

首届音乐源修复挑战赛 (MSR Challenge) 数据集概述

基本信息

名称: 首届音乐源修复挑战赛 (The Inaugural Music Source Restoration Challenge)
关联会议: ICASSP 2026
官方邮箱: admin@msrchallenge.com

挑战目标

连接学术研究与实际音频工程需求，包括：

档案保存
专业混音
历史录音恢复
受场地声学影响的现场表演增强

数据集资源

MSRBench 数据集: 可下载
基线系统权重: 可下载
评估协议: 可下载（最后更新 2025年10月01日）
基线论文: 可下载（最后更新 2025年10月12日）
入门工具包代码库: 可用

重要日期

注册开始: 2025年8月15日
验证集发布: 2025年9月21日
基线系统发布: 2025年10月01日
测试集发布: 2025年11月18日
最终提交截止: 2025年11月20日
数据提交截止: 2025年11月26日
结果公布: 2025年11月27日
2页论文提交截止（邀请制）: 2025年12月7日

最新公告

2025年10月1日: 更新评估协议，允许在测试提交截止后发布数据

搜集汇总

数据集介绍

构建方式

在音乐信息检索领域，专业数据集构建需要兼顾真实性与可控性。MSRBench通过与专业混音工程师合作，采用三阶段标准化流程构建：首先对八类乐器原始干声进行独立处理，包括均衡器调整、动态压缩与空间效果添加；随后通过增益分级与总线处理完成多轨混音；最终经过母带处理形成参考混音版本。该流程完整复现了专业音乐制作环境，同时保留了未经处理的原始干声作为基准参照。

特点

该数据集的核心特征体现在多维度的真实性模拟。除了包含2000段专业混音的10秒立体声音频外，还系统集成了12类现实场景退化效果：模拟类退化复现了广播传输与历史媒介的声学特性，传统编解码器覆盖了主流流媒体平台的压缩场景，神经编解码器则引入了新兴压缩方法特有的量化失真。这种分层设计使得数据集能够全面评估模型在不同退化条件下的恢复能力，为音乐源修复研究提供了前所未有的测试广度。

使用方法

在模型评估实践中，该数据集支持分层验证框架。研究者可首先在原始混音条件下测试基础分离性能，继而通过三类退化场景检验模型鲁棒性。评估指标采用信号级保真度与感知质量的双重标准：SI-SNR量化波形重建精度，FADCLAP则通过对比学习音频预训练嵌入空间中的分布距离来评估听觉自然度。这种评估方案既关注技术指标的严谨性，又兼顾实际应用中的听觉体验，为音乐源修复技术的全面发展提供了标准化测试基准。

背景与挑战

背景概述

音乐源修复作为音频信号处理领域的前沿方向，由索尼AI、伦敦国王学院等机构于2025年联合提出，旨在解决传统音乐源分离在真实场景中的局限性。该领域聚焦于还原经过均衡器、动态压缩等专业处理及现实环境退化后的原始音频信号，突破了线性混合假设的框架。MSRBench作为首个专业级基准数据集，通过两千条由工程师制作的原始-处理后音频对，为评估分离精度与修复保真度建立了标准化范式，推动了音乐制作与音频修复技术的交叉融合。

当前挑战

在领域问题层面，音乐源修复需应对相位估计误差、瞬态信号建模困难等核心挑战，如打击乐器的SI-SNR低至-55.2dB而贝斯仅-17.3dB，揭示了谐波结构与瞬态特征对修复模型的差异化需求。构建过程中，数据采集面临专业级原始素材稀缺的瓶颈，现有公开数据集多为处理后素材，迫使研究者采用模拟混合等次优策略。此外，传统客观指标与感知质量存在显著差异，如BSRNN模型FADCLAP达0.74时SI-SNR仅-23.4dB，凸显了评估体系亟待向感知导向转型的迫切性。

常用场景

经典使用场景

在音乐信号处理领域，MSRBench作为首个专门针对音乐源修复任务的基准数据集，其经典应用场景聚焦于评估模型在真实音频制作环境下的恢复能力。该数据集通过提供未经处理的原始音轨与专业混音师制作的混合音频平行对，使研究者能够系统测量模型在均衡化、动态压缩、空间效果等制作效应干扰下的分离精度与修复保真度。特别是其涵盖的十二类现实退化场景——从模拟广播信号衰减到神经编解码器量化失真——为跨场景稳健性验证提供了标准化测试平台。

衍生相关工作

基于MSRBench的基准特性，学界已涌现出多项创新研究。BSRNN与U-Net的改进版本开始融入复数谱域处理以解决相位估计难题，MelBand-RoFormer等架构则探索了乐器自适应的频带划分策略。在评估体系方面，CLAP嵌入空间与无参考指标逐渐替代传统信噪比测量，如VoiceFixer引入的神经声码器与Apollo设计的序列建模方法。这些工作共同推动了从纯分离任务向生成式修复范式的理论转变。

数据集最近研究