ACMID
收藏github2025-10-09 更新2025-10-11 收录
下载链接:
https://github.com/scottishfold0621/ACMID
下载链接
链接失效反馈官方服务:
资源简介:
ACMID是一个通过自动网络爬取和数据清理构建的高质量、高粒度7-stem音乐源分离数据集,包含钢琴、鼓、贝斯、原声吉他、电吉他、弦乐和管乐-铜管乐7种乐器分类,填补了细粒度音乐源分离研究的空白,经证明能提升音乐源分离性能2.39dB
ACMID is a high-quality, fine-grained 7-stem music source separation dataset constructed through automated web crawling and data cleaning. It covers seven instrument categories: piano, drums, bass, acoustic guitar, electric guitar, strings, and wind-brass instruments, which fills the gap in fine-grained music source separation research. It has been proven to improve the performance of music source separation by 2.39 dB.
创建时间:
2025-09-16
原始信息汇总
ACMID数据集概述
项目简介
ACMID(自动音乐乐器数据集构建)是一个用于7音轨音乐源分离的高质量数据集构建项目。该项目通过自动化网络爬取和数据清洗流程,解决了音乐源分离研究中的关键限制。
主要贡献
自动化数据处理流程
- 提供开源网络爬取和清洗代码
- 支持多语言查询从YouTube爬取目标乐器原始视频
- 使用预训练音频编码器二元分类器清洗原始数据
高粒度分离能力
- 扩展音乐源分离从4音轨到7音轨
- 支持细粒度乐器分离,涵盖以下7类乐器:
- 钢琴
- 鼓
- 贝斯
- 原声吉他
- 电吉他
- 弦乐器
- 管乐器-铜管乐器
验证效果
- ACMID清洗后数据相比未清洗数据提升MSS性能2.39dB
- 与现有数据集结合使用时,将SOTA模型(SCNet)性能提升1.16dB
技术特性
- 构建高质量、高粒度的7音轨数据集
- 实现细粒度单个乐器的分离能力
- 填补细粒度音乐源分离研究空白
相关资源
- 预训练模型:https://zenodo.org/records/13315686/files/dasheng_audioset_mAP497.pt?download=1
- 项目代码库:https://github.com/scottishfold0621/ACMID
搜集汇总
数据集介绍

构建方式
在音乐信息检索领域,数据质量直接影响源分离模型的性能。ACMID数据集通过自动化网络爬虫技术,从YouTube平台采集多语言查询下的原始乐器演奏视频,构建初始音频库。随后采用预训练的音频编码器二分类器进行数据清洗,筛选出高置信度的纯净音频片段,最终形成涵盖七种乐器音轨(钢琴、鼓、贝斯、原声吉他、电吉他、弦乐、管乐)的高精度数据集。
特点
该数据集突破传统四音轨分离的局限,首次实现七种乐器音轨的细粒度划分,填补了高粒度音乐源分离研究的空白。其核心优势体现在自动化流程带来的可复现性,以及经过严格清洗后高达2.39dB的性能提升。通过与现有数据集结合,能进一步提升前沿模型SCNet的性能表现1.16dB,展现出卓越的兼容性与实用性。
使用方法
研究者可通过GitHub仓库获取完整代码与预训练模型,使用search_youtube.py脚本执行多语言网络爬虫,生成目标乐器的原始数据索引。借助inference.py加载对应乐器的清洗模型,通过调整置信度阈值对音频文件进行智能筛选。该流程支持自定义输入输出路径,便于集成到现有音乐处理管道中,为源分离研究提供端到端的解决方案。
背景与挑战
背景概述
音乐源分离领域长期受限于数据集的粒度和质量,传统方法多聚焦于四声部分离,难以满足精细化的音乐分析需求。ACMID数据集由研究团队于2026年提出,通过自动化网络爬取与数据清洗技术,构建了涵盖钢琴、鼓、贝斯等七类乐器的多声部数据集。该工作将音乐源分离的粒度从四声部扩展至七声部,显著提升了乐器分离的精确度,为计算音乐学与音频信号处理研究提供了关键数据支撑。
当前挑战
在音乐源分离领域,高粒度乐器分离面临声学特征重叠与混响干扰的技术瓶颈。ACMID构建过程中需克服多语言视频检索的语义噪声,并通过预训练分类器实现亿级规模数据的精准清洗。数据质量控制要求剔除含背景音或演奏错误的片段,其阈值设定的平衡性直接影响模型泛化能力。
常用场景
经典使用场景
在音乐信息检索领域,ACMID数据集通过其高精度的7音轨分离能力,为音乐源分离研究提供了经典范例。该数据集支持对钢琴、鼓、贝斯等七种乐器进行细粒度分离,使研究人员能够深入分析多乐器混合音频中的独立声源成分。这种精细划分不仅提升了分离的准确性,还为复杂音乐结构的解析奠定了数据基础。
解决学术问题
该数据集有效解决了音乐源分离研究中数据粒度不足的核心问题。传统4音轨分离方法难以捕捉特定乐器的声学特征,而ACMID通过自动化数据清洗流程构建的7音轨体系,将分离性能提升2.39dB。这一突破使得对弦乐、管乐等特定乐器声源的研究成为可能,推动了细粒度音乐分析理论的发展。
衍生相关工作
该数据集的发布催生了多项创新研究,其中最具代表性的是SCNet模型的性能提升工作。通过融合ACMID清洗后的数据,SCNet在音乐源分离任务中实现了1.16dB的性能增益。后续研究进一步拓展了该数据集的适用场景,衍生出基于多语言查询的音频检索系统和跨乐器迁移学习框架等方向。
以上内容由遇见数据集搜集并总结生成



