five

Rhythmic Pattern Transcription Dataset

收藏
arXiv2025-10-07 更新2025-10-09 收录
下载链接:
https://github.com/YousicianGit/rhythmic-pattern-transcription
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集由410首流行歌曲的节奏模式转录组成,涵盖了从简化到原始艺术家演奏的节奏模式。数据集包括931个专有录音,其中每个歌曲版本都有分离的伴奏、人声和吉他轨道,以及相应的转录。数据集主要关注节奏吉他的节奏模式,旨在从多声部音乐中提取有意义的节奏模式并将其转换为可读的表示形式,包括自动生成的小节线和拍号标记。

This dataset comprises rhythmic pattern transcriptions of 410 popular songs, encompassing rhythmic variants ranging from simplified renditions to those from original artist performances. The dataset contains 931 proprietary recordings, where each song version has separated accompaniment, vocal, and guitar tracks along with corresponding transcriptions. Focusing primarily on the rhythmic patterns of rhythm guitar, this dataset aims to extract meaningful rhythmic patterns from polyphonic music and convert them into readable representations, including automatically generated bar lines and time signature markers.
提供机构:
Yousician, Helsinki, Finland
创建时间:
2025-10-07
原始信息汇总

数据集概述

基本信息

  • 数据集名称:rhythmic-pattern-transcription
  • 关联论文:Transcribing Rhythmic Patterns of the Guitar Track in Polyphonic Music
  • 论文链接:https://arxiv.org/abs/2510.05756

数据集内容

  • 数据来源:论文中使用的保留测试集片段
  • 数据格式:音频片段
  • 数据组织:按难度级别分类(简化、中级、高级、原始)
  • 每个难度级别样本数量:2个片段

数据文件说明

  • 完整混音文件{difficulty}_{i}_full_mix.ogg - 包含所有乐器的完整混音音频
  • 吉他轨道文件{difficulty}_{i}_guitar_with_clicks - 在混合前分离的目标吉他轨道,在弹奏起始点添加了点击声

技术说明

  • 片段时长:10秒
  • 音乐类型:包含吉他的复调音乐
  • 预测方法:使用基于MERT的模型在other音轨上进行微调,所有预测均在other音轨上完成
  • 处理工具:提供节拍处理脚本和依赖管理工具
搜集汇总
数据集介绍
main_image_url
构建方式
在音乐信息检索领域,Rhythmic Pattern Transcription Dataset的构建采用了专家标注与多版本覆盖的创新方法。研究团队邀请专业音乐家对410首流行歌曲的吉他节奏模式进行人工转录,并录制了涵盖简化版、中级版、高级版及原曲版四种难度等级的覆盖版本。通过近似音轨分离技术从多声部混合音频中提取吉他部分,结合预训练基础模型MERT进行拨弦检测,最终利用动态规划算法将拨弦序列解码为专家预定义的节奏模式词汇表,确保了数据标注的精确性与可解释性。
特点
该数据集的核心特征体现在其多层次结构与专业标注体系。收录的931条录音均包含独立的伴奏、人声和吉他音轨,并配备对应转录文本,其中原声钢弦吉他的节奏模式以十六分音符为最小粒度进行标注。数据涵盖多种拍号与流派分布,尤以4/4拍和流行摇滚风格为主。独特之处在于每个歌曲版本均保留了核心音乐元素,而不同难度版本通过调整调性、简化节奏或缩短时长来实现渐进式学习目标,为研究多声部音乐中的节奏模式识别提供了标准化评估基准。
使用方法
该数据集的应用方法聚焦于多模态音乐分析任务。研究者可基于分离后的吉他音轨或混合音频,采用微调后的MERT模型进行帧级拨弦检测,继而通过维特比算法实现节奏模式序列解码。评估时需结合重构拨弦序列的F1分数与模式连续性指标,同时利用自动生成的节拍线和拍号标记提升转录结果的可读性。该数据集特别适用于跨难度级别的泛化能力测试,其合成数据增强策略也为模型抗噪性能验证提供了有效支撑。
背景与挑战
背景概述
在音乐信息检索领域,节奏模式转录作为和弦分析的重要补充,长期处于研究边缘。2025年由Yousician机构学者Aleksandr Lukoianov与Anssi Klapuri构建的《节奏模式转录数据集》,通过专家音乐家对410首流行歌曲进行人工标注,涵盖简化版至原版共931个吉他音轨,开创性地建立了多难度层级的节奏模式标注体系。该数据集聚焦于多音轨音乐中吉他声部的节奏型编码,其以十六分音符为最小单位的模式词汇表,为音乐结构解析与表演教学提供了标准化参照。
当前挑战
该数据集核心挑战体现在算法与数据两个维度:在领域问题层面,多音轨混合场景下的吉他拨弦检测需克服声源分离残留伪影的干扰,同时需解决伴奏音轨中多重吉他声部的交叉影响;在构建过程中,专家标注存在表演性节奏偏移与模式变奏,导致标注噪声,而有限数据规模迫使模型依赖预训练架构的迁移能力。此外,节拍线估计的时序稳定性与模式序列解码的可读性平衡,构成算法落地的关键瓶颈。
常用场景
经典使用场景
在音乐信息检索领域,Rhythmic Pattern Transcription Dataset为吉他节奏模式转录研究提供了标准化基准。该数据集通过专家标注的410首流行歌曲节奏模式,构建了包含四个难度等级的931个专业录音版本,为多音轨音乐中吉他声部的节奏分析建立了可靠基础。研究者可利用该数据集训练模型从复杂音频混合中分离吉他声部,并准确识别其节奏模式序列,推动自动音乐转录技术的发展。
实际应用
在音乐教育领域,该数据集支撑的节奏转录技术可自动生成吉他演奏谱例,为学习者提供标准化的节奏模式参考。音乐制作场景中,制作人能够快速提取参考曲目的节奏结构用于编曲创作。数字乐谱平台则可基于此技术实现音频到乐谱的自动转换,极大提升了音乐内容生产的效率。这些应用不仅降低了音乐学习的门槛,更为音乐创作与传播提供了智能化工具。
衍生相关工作
该数据集推动了基于MERT等预训练模型的迁移学习研究,衍生出融合声部分离与节奏识别的端到端系统。相关研究扩展了动态规划在音乐模式解码中的应用,发展了考虑时间连续性的模式转移概率模型。在评估体系方面,催生了兼顾准确性与可读性的新型评价指标,为音乐转录任务建立了更全面的评估标准。这些工作共同构建了节奏模式分析的技术生态,为后续研究提供了重要参考。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作