MelodySim

github2025-05-29 更新2025-06-12 收录

下载链接：

https://github.com/AMAAI-Lab/MelodySim

下载链接

链接失效反馈

官方服务：

资源简介：

MelodySim数据集包含1,710首源自Slakh2100数据集的有效合成乐曲，每首乐曲包含4种不同的版本（通过各种增强设置生成），总时长为419小时。该数据集专注于旋律相似性，并通过用户研究确认正样本对确实包含相似的旋律，而其他音乐轨道则显著变化。

The MelodySim dataset comprises 1,710 valid synthesized musical pieces derived from the Slakh2100 dataset. Each piece includes four distinct versions generated via various augmentation settings, with a total duration of 419 hours. This dataset focuses on melody similarity, and user studies have confirmed that positive sample pairs indeed contain similar melodies, while other musical tracks vary significantly.

创建时间：

2025-05-20

原始信息汇总

MelodySim数据集概述

数据集简介

名称：MelodySim
目的：用于旋律感知音乐相似性检测和抄袭识别
数据来源：基于Slakh2100 MIDI数据集进行增强生成
数据量：1,710个有效合成音乐片段
版本数量：每个原始片段包含4种不同增强版本
总时长：419小时

数据集特点

增强方法：
- 音符分割
- 琶音处理
- 次要音轨丢弃(保留贝斯)
- 重新配器
验证方式：通过用户研究确认正样本对确实包含相似旋律

技术指标

测试结果：

精确率召回率 F1值

不同曲目 1.00 0.94 0.97

相似曲目 0.94 1.00 0.97

平均值 0.97 0.97 0.97

准确率 0.97

引用格式

bibtex @article{lu2025melodysim, title={Text2midi-InferAlign: Improving Symbolic Music Generation with Inference-Time Alignment}, author={Tongyu Lu and Charlotta-Marlena Geist and Jan Melechovsky and Abhinaba Roy and Dorien Herremans}, year={2025}, journal={arXiv:2505.20979} }

搜集汇总

数据集介绍

构建方式

在音乐信息检索领域，MelodySim数据集的构建采用了创新的旋律保留增强技术。基于Slakh2100这一现有MIDI数据集，研究团队通过音符分割、琶音处理、次要音轨丢弃（保留贝斯轨道）以及音色重置等多种数据增强手段，为每首乐曲生成了四个保留核心旋律的变体版本。这种构建方式既确保了原始旋律的完整性，又通过用户研究验证了变体间旋律相似性的有效性，为音乐抄袭检测任务提供了可靠的基准数据。

特点

该数据集包含1,710首源自Slakh2100的合成音乐片段，总时长达419小时，每个原始片段均配有四种经过专业增强的变体版本。其核心特征在于严格控制的旋律相似性与多样化的伴奏变化，通过MERT编码器和三重神经网络构建的检测模型在该数据集上取得了97%的准确率，精准平衡了旋律特征提取与伴奏干扰排除的技术挑战。

使用方法

使用该数据集需先通过专用脚本提取MERT音频特征，训练阶段采用基于片段的对比学习方法。推理时支持自定义相似度判定阈值、最小匹配窗口等参数，用户只需提供两段音频路径及预训练模型即可获得抄袭检测结果。测试脚本可自动计算精确率、召回率等指标，并支持通过max_num_anchors参数控制测试样本规模，为研究者提供灵活的评估方案。

背景与挑战

背景概述

MelodySim数据集由AMAAI实验室于2025年推出，旨在解决音乐领域中旋律相似性度量的核心问题。该数据集基于Slakh2100这一现有MIDI数据集，通过创新的数据增强方法构建而成，包括音符分割、琶音生成、次要音轨丢弃以及重新配器等技术，确保在生成多样版本的同时保留原始旋律特征。其研究团队在arXiv上发表的论文详细阐述了这一旋律感知模型的构建原理，该工作对音乐抄袭检测、自动作曲等应用场景具有显著推动作用。数据集包含1,710首经过验证的合成乐曲，总时长达419小时，为音乐信息检索领域提供了重要的基准资源。

当前挑战

在解决旋律相似性检测这一领域问题时，MelodySim面临如何准确定义和量化主观听觉感知的挑战。音乐旋律的相似性不仅涉及音高序列匹配，还需考虑节奏、和声上下文等复杂因素。数据集构建过程中，研究团队需克服数据增强的保真度问题：既要通过音符分割等技术创造足够多样的变体，又要确保核心旋律特征不被破坏。此外，从Slakh2100原始数据到多版本生成的转换中，如何平衡自动化处理与人工验证的关系，以及如何处理不同乐器音色对旋律感知的影响，都是构建阶段的关键技术难点。

常用场景

经典使用场景

在音乐信息检索领域，MelodySim数据集通过其独特的旋律相似性标注，为研究者提供了一个标准化的评估平台。该数据集广泛应用于音乐抄袭检测算法的开发与验证，特别是在处理旋律变体识别时展现出显著优势。其基于Slakh2100数据集的增强版本，通过多种旋律保留性变换生成对比样本，为模型训练提供了丰富的正负例对。

衍生相关工作

基于MelodySim的基准测试催生了多项创新研究，包括融合多模态特征的混合相似度算法、基于注意力机制的旋律对齐模型等。其数据构建方法被Adaptive Music Transformer等后续工作借鉴，MERT编码器的应用也启发了音乐预训练模型的研究。相关成果在ISMIR、ICASSP等顶级会议形成系列论文。

数据集最近研究

	精确率	召回率	F1值
不同曲目	1.00	0.94	0.97
相似曲目	0.94	1.00	0.97
平均值	0.97	0.97	0.97
准确率			0.97