musdb18-processed
收藏MUSDB18 Active Stems Dataset - CS229 Project
数据集概述
这是一个基于MUSDB18数据集的处理版本,专门提取了各音轨(鼓、贝斯、人声、伴奏和混合)的有效片段,旨在提高音乐源分离模型的训练效率。
关键特性
- 有效片段检测:仅包含具有显著能量的音轨片段
- 5种音轨:混合音轨、鼓、贝斯、人声、伴奏
- 统一格式:22.05 kHz采样率,单声道音频
- 丰富元数据:详细的片段信息和统计信息
数据集结构
extracted_stems/ ├── train/ # 训练集 │ ├── drums/ # 有效鼓片段 │ ├── bass/ # 有效贝斯片段 │ ├── vocals/ # 有效人声片段 │ ├── accompaniment/ # 有效伴奏片段 │ └── mixture/ # 有效混合片段 ├── test/ # 测试集(相同结构) └── metadata/ # JSON元数据文件
提取参数
- 片段长度:4.0秒
- 跳跃长度:2.0秒(50%重叠)
- 能量阈值:0.01 RMS
- 采样率:22,050 Hz
- 最小持续时间:1.0秒
引用信息
bibtex @dataset{cs229_musdb18_active_stems, title={MUSDB18 Active Stems Dataset}, author={CS229 Audio ML Project Team}, year={2025}, publisher={Hugging Face}, url={https://huggingface.co/datasets/cs229-audio-ml-project/musdb18-processed} }
原始MUSDB18引用: bibtex @misc{musdb18, author = {Rafii, Zafar and Liutkus, Antoine and Stöter, Fabian-Robert and Mimilakis, Stylianos Ioannis and Bittner, Rachel}, title = {MUSDB18-HQ - an uncompressed version of MUSDB18}, month = {December}, year = {2019}, doi = {10.5281/zenodo.3338373}, url = {https://doi.org/10.5281/zenodo.3338373} }




