GuitarDuets
收藏arXiv2025-07-02 更新2025-07-04 收录
下载链接:
https://zenodo.org/records/12802440
下载链接
链接失效反馈官方服务:
资源简介:
GuitarDuets数据集是一个包含真实和合成古典吉他二重奏录音的数据集,总时长约为3小时。该数据集包括约58.6分钟的真实录音和106分钟的合成录音,并附带部分音符级别标注,可用作辅助乐谱信息。数据集旨在为单音色音乐源分离任务提供训练和评估深度学习算法的原始和逼真吉他二重奏录音。真实录音在安静、声学处理的房间中使用高品质电容式麦克风录制,而合成录音则利用在线转录和虚拟乐器生成。
提供机构:
雅典研究与创新中心机器人技术研究所, 雅典研究与创新中心语言与语音处理研究所, 雅典国立技术大学电子与计算机工程系
创建时间:
2025-07-02
原始信息汇总
GuitarDuets 数据集概述
基本信息
- 标题: GuitarDuets
- 发布版本: version-1.0
- 发布日期: 2024年7月23日
- DOI: 10.5281/zenodo.12802440
- 资源类型: 数据集
- 许可证: Creative Commons Attribution 4.0 International
- 发布者: Zenodo
创作者
- Glytsos, Marios (Researcher) - 国家技术大学雅典分校
- Garoufis, Christos (Researcher) - Athena研究与创新中心
- Zlatintsi, Athanasia (Researcher) - Athena研究与创新中心
- Maragos, Petros (Supervisor) - 国家技术大学雅典分校
数据集描述
- 内容: 提供高质量古典吉他二重奏录音及MIDI注释。
- 数据量: 约3小时的实时和合成古典吉他二重奏录音。
- 注释: 合成二重奏包含音符级MIDI注释。
- 录音设备: 使用Presonus PM-2高质量电容麦克风,每个吉他一个麦克风。
- 录音环境: 在安静、声学处理的房间内进行。
- 文件格式: 44,100 Hz, 16-bit WAV文件,立体声格式。
- 目的: 用于开发和评估单调音乐源分离算法。
文件信息
- 文件名称: GuitarDuets.zip
- 文件大小: 3.5 GB
- MD5校验值: b4f03550a01f1dd35b9b3c258702b982
统计信息
- 总浏览量: 174
- 总下载量: 28
- 总数据量: 141.4 GB
引用信息
- 建议引用: Glytsos, M., Garoufis, C., Zlatintsi, A., & Maragos, P. (2024). GuitarDuets (version-1.0) [Data set]. 25th International Society of Music Information Retrieval Conference (ISMIR), San Fransisco, CA, USA. Zenodo. https://doi.org/10.5281/zenodo.12802440
相关会议
- 会议名称: 25th International Society of Music Information Retrieval Conference (ISMIR)
- 会议地点: San Fransisco, CA, USA
- 会议日期: 2024年11月10-14日
搜集汇总
数据集介绍

构建方式
GuitarDuets数据集的构建融合了真实录音与合成数据两种方式,以解决单音色音乐源分离研究的稀缺性问题。真实录音部分在专业声学环境中采用高灵敏度电容麦克风同步录制四位演奏者的古典吉他二重奏,涵盖现代古典、新探戈等多种风格,并通过更换乐器增强音色多样性。合成数据部分则基于MuseScore社区的开源MIDI乐谱,利用虚拟吉他音源和数字音频工作站生成高质量仿真演奏,有效扩充了数据规模。两种数据均以44.1kHz/16bit的WAV格式保存,并包含立体声与单声道混合版本。针对真实录音中的串音问题,专门制作了无串音的测试子集以确保评估可靠性。
特点
该数据集的核心价值在于其专注于单音色分离场景,包含总计164.6分钟的真实与合成吉他二重奏数据,填补了同类乐器分离研究的数据空白。真实录音部分(58分钟)通过多吉他配置和风格多样性呈现丰富的音色变化,而合成数据(106分钟)则提供精确的MIDI标注支持算法开发。相较于现有数据集,GuitarDuets创新性地整合了真实演奏的声学特性与合成数据的可扩展性,其部分曲目配备音符级标注的特性,为基于乐谱信息的分离算法研究提供了可能。数据统计显示合成曲目平均每秒含7个音符,为密集和声场景下的算法测试创造了条件。
使用方法
该数据集适配多种研究范式,既支持传统盲源分离任务,也可用于乐谱引导的分离算法开发。在使用Demucs等分离架构时,建议采用混合域Transformer结构处理时频双路径信息,并通过排列不变损失函数解决声道置换问题。对于合成数据子集,可将MIDI标注转换为二进制活动向量,作为时域或频域分支的条件输入。联合训练方案中,可先通过残差交换网络生成音符预测,再将其作为辅助特征输入分离网络。评估时需注意SDR等指标在单音色分离场景可能存在的偏差,建议结合听觉测试进行综合评判。
背景与挑战
背景概述
GuitarDuets数据集由希腊雅典国家技术大学和雅典研究中心的机器人研究所、语言与语音处理研究所的研究团队于2025年推出,专注于解决单调音色音乐源分离(MSS)的核心问题。该数据集包含约3小时的古典吉他二重奏真实录音与合成录音,并附有音符级标注,填补了现有数据集中针对同家族乐器分离研究的空白。其创新性在于首次系统性地整合了真实演奏与虚拟乐器生成的混合数据,为音乐信息检索领域提供了研究同质乐器声部分离的新基准。
当前挑战
该数据集面临双重挑战:在领域问题上,需解决同质乐器(如两把古典吉他)声谱高度相似导致的分离困难,传统基于音色差异的分离算法在此场景下性能显著下降;在构建过程中,真实录音存在跨麦克风串音干扰,需设计专用无串音测试集以保证数据质量。此外,合成数据与真实数据的声学特性差异要求模型具备跨域泛化能力,而音符标注的不完整性和转录网络的误差传播进一步增加了联合转录-分离框架的开发难度。
常用场景
经典使用场景
在音乐信息检索领域,GuitarDuets数据集为单调音色音乐源分离(MSS)研究提供了重要支持。该数据集通过真实与合成的古典吉他二重奏录音,填补了同类乐器分离任务的空白。其最经典的应用场景在于训练和评估深度神经网络模型,尤其是针对音色相近的吉他声部分离任务。研究人员可利用该数据集探索乐器间细微音色差异的捕捉方法,以及多轨录音中声部独立性的保持技术。
衍生相关工作
该数据集已催生多项创新研究,包括基于Hybrid Transformer Demucs架构的改进模型和联合转录-分离框架。相关衍生工作探索了音符活动标签在时频双域的条件注入策略,推动了permutation-invariant损失函数在乐器分离中的应用。部分研究进一步扩展了数据集在跨域评估中的价值,如比较真实与合成数据的训练效果差异,这些工作为音乐人工智能领域建立了新的方法论基准。
数据集最近研究
最新研究方向
近年来,音乐源分离(MSS)领域的研究逐渐从多音色分离转向单音色分离,特别是针对具有相似音色特征的乐器分离。GuitarDuets数据集的引入填补了这一研究空白,为古典吉他二重奏的分离提供了丰富的真实和合成录音资源。该数据集不仅包含约三小时的录音,还提供了合成录音的音符级标注,为算法训练和详细分析提供了有力支持。前沿研究方向包括基于分数信息的分离框架和联合转录-分离架构的开发,这些方法通过利用音符级预测作为辅助信息,显著提升了分离性能。此外,研究还探讨了常用评估指标在单音色分离中的适用性,揭示了其在相似音色源分离中的局限性。GuitarDuets数据集的发布不仅推动了单音色音乐源分离技术的发展,也为音乐信息检索领域的多模态研究提供了新的可能性。
相关研究论文
- 1Classical Guitar Duet Separation using GuitarDuets -- a Dataset of Real and Synthesized Guitar Recordings雅典研究与创新中心机器人技术研究所, 雅典研究与创新中心语言与语音处理研究所, 雅典国立技术大学电子与计算机工程系 · 2025年
以上内容由遇见数据集搜集并总结生成



