MTASS

Name: MTASS
Creator: OpenDataLab
Published: 2026-05-17 05:30:18
License: 暂无描述

OpenDataLab2026-05-17 更新2024-05-09 收录

下载链接：

https://opendatalab.org.cn/OpenDataLab/MTASS

下载链接

链接失效反馈

官方服务：

资源简介：

音频源分离任务，例如语音增强、语音分离和音乐源分离，在最近的研究中取得了令人瞩目的表现。深度神经网络强大的建模能力让我们对更具挑战性的任务充满希望。本文发起了一项新的多任务音频源分离 (MTASS) 挑战，将语音、音乐和噪声信号从单声道混合中分离出来。首先，我们介绍了这项任务的细节，并生成了一个包含语音、音乐和背景噪声的混合数据集。然后，我们提出了一个复杂域中的 MTASS 模型，以充分利用三个音频信号的频谱特性差异。具体来说，所提出的模型遵循两级流水线，将三种音频信号分离，然后分别进行信号补偿。在比较不同的训练目标后，选择复比掩模作为MTASS更合适的目标。实验结果还表明，残差信号补偿模块有助于进一步恢复信号。与几种众所周知的分离模型相比，所提出的模型在分离性能方面显示出显着优势。

提供机构：

OpenDataLab

创建时间：

2022-06-23

搜集汇总

数据集介绍