Jazz Piano Style Dataset
收藏arXiv2025-04-07 更新2025-04-09 收录
下载链接:
https://cms.mus.cam.ac.uk/jazz-piano-style-ml
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含由20位著名表演者演奏的爵士钢琴即兴表演的录音,使用自动系统转录为MIDI“钢琴卷”格式。数据集中的表演既有合奏也有独奏,这两种风格的表演在系统上有明显的不同。数据来源于两个现有的开源数据集:Jazz Trio Database (JTD) 和 Piano Jazz with Automatic MIDI Annotations (PiJAMA)。经过筛选和预处理,最终形成了包含1629场表演、总时长84小时的数据集。该数据集旨在帮助研究音乐理论和音乐家在音乐风格上的各种问题。
This dataset contains recordings of jazz piano improvisations performed by 20 renowned performers, which were transcribed into MIDI "piano roll" format using an automated system. The performances in the dataset cover both ensemble and solo styles, which exhibit notable systematic differences. The final dataset is compiled through screening and preprocessing, derived from two existing open-source datasets: the Jazz Trio Database (JTD) and Piano Jazz with Automatic MIDI Annotations (PiJAMA). It consists of 1,629 performances with a total duration of 84 hours, and is designed to facilitate research on various issues related to music theory and musicians' musical styles.
提供机构:
剑桥大学音乐与科学中心
创建时间:
2025-04-07
搜集汇总
数据集介绍

构建方式
Jazz Piano Style Dataset的构建基于两个现有的开源数据集:Jazz Trio Database (JTD) 和 Piano Jazz with Automatic MIDI Annotations (PiJAMA)。JTD包含了34位爵士钢琴家在贝斯手和鼓手伴奏下的1,294段即兴独奏录音,而PiJAMA则包含了120位钢琴家的2,777段无伴奏完整演奏录音。这些录音通过自动音乐转录系统转换为MIDI格式,并经过手动修剪和源分离处理以提取钢琴部分。最终数据集筛选了20位钢琴家,共计84小时的录音,分为训练、验证和测试三个子集,比例为8:1:1。
特点
该数据集的特点在于其多样性和专业性,涵盖了20位标志性爵士钢琴家的演奏风格,包括合奏和独奏两种表演形式。数据集通过MIDI钢琴卷帘格式记录了演奏的旋律、和声、节奏和动态四个音乐维度。此外,数据集还通过数据增强技术(如音高、时间和速度的随机变换)提高了模型的泛化能力。数据集的另一个显著特点是其高精度转录,时间分辨率为每秒100帧,确保了微观节奏信息的完整性。
使用方法
该数据集的使用方法包括训练和评估多种监督学习模型,如随机森林、支持向量机和逻辑回归,以及深度学习模型如卷积神经网络(CNN)和残差网络(ResNet)。模型输入可以是整个录音或30秒的片段,通过聚合片段级别的预测结果来获得曲目级别的分类准确率。数据集还支持多输入表示方法,允许模型分别分析旋律、和声、节奏和动态四个音乐维度。此外,数据集附带了一个交互式网络应用程序,用户可以通过该程序探索不同钢琴家的风格特征和代表性录音片段。
背景与挑战
背景概述
Jazz Piano Style Dataset由剑桥大学音乐与科学中心的Huw Cheston、Reuben Bance和Peter M. C. Harrison于2025年创建,旨在通过机器学习解构爵士钢琴演奏风格。该数据集包含20位标志性爵士钢琴家的84小时录音,通过自动转录系统转换为MIDI格式。研究核心问题聚焦于如何利用计算模型捕捉和解释艺术风格的特征,特别是在音乐表演中旋律、和声、节奏和动态等维度的独特表现。该数据集不仅推动了音乐信息检索和可解释人工智能的发展,还为音乐理论和教育提供了新的研究工具。
当前挑战
构建Jazz Piano Style Dataset面临多重挑战。首先,在领域问题方面,如何准确捕捉和量化爵士钢琴演奏中的主观风格元素(如即兴创作的独特性和表现力)是一个核心难题。其次,在数据集构建过程中,自动转录系统在处理复杂的爵士钢琴演奏时可能引入错误,尤其是在多音轨录音中分离钢琴声部。此外,确保数据集的代表性和平衡性(如不同演奏家的录音时长差异)也是重要挑战。最后,开发能够解释模型决策过程的算法,以提供对音乐风格的人类可理解的见解,是另一个关键挑战。
常用场景
经典使用场景
Jazz Piano Style Dataset作为音乐信息检索领域的标杆数据集,其核心应用场景在于通过机器学习方法解构爵士钢琴演奏风格特征。该数据集收录了20位标志性爵士钢琴演奏家共计84小时的即兴演奏录音,并转化为MIDI钢琴卷帘格式,为研究者提供了分析旋律走向、和声进行、节奏模式和力度变化等多维度音乐特征的标准化数据基础。在典型应用中,研究者可利用该数据集训练监督学习模型,实现演奏者身份识别任务,同时通过模型可解释性技术揭示不同音乐家独特的演奏风格指纹。
实际应用
在音乐教育领域,该数据集支撑的交互式网络应用可帮助学习者直观理解Bill Evans的七度琶音、Oscar Peterson的环绕音等典型演奏特征。在数字音乐ology研究中,其多模态表示方法为自动音乐标注系统提供了新的特征提取范式。文化产业方面,基于该数据集开发的演奏风格分析模型已应用于音乐版权识别和数字遗产保护,其演奏者识别准确率最高达94%,为音乐内容管理提供了技术保障。
衍生相关工作
该数据集催生了多个里程碑式研究:Frieler等人(2018)开发的旋律模式分析工具扩展了其教育应用场景;Cheston等人(2024b)基于该数据集构建的节奏特征模型揭示了微观节奏与演奏风格的关联;Foscarin等人(2022)提出的概念激活分析方法被广泛应用于跨艺术领域的风格解释研究。此外,其多输入架构设计启发了Ramoneda等人(2024)在音乐难度评估系统中的模块化特征提取方案。
以上内容由遇见数据集搜集并总结生成



