Pianism-Labelling Dataset (PLD)

Name: Pianism-Labelling Dataset (PLD)
Creator: 数字音乐中心，伦敦玛丽女王大学
Published: 2024-07-05 22:01:27
License: 暂无描述

arXiv2024-07-05 更新2024-07-09 收录

下载链接：

https://bit.ly/3SYzozY

下载链接

链接失效反馈

官方服务：

资源简介：

Pianism-Labelling Dataset (PLD) 是由数字音乐中心，伦敦玛丽女王大学创建的一个大型数据集，专注于西方古典钢琴独奏音乐的表现理解。该数据集包含136小时的音频和详细标注，涵盖了专业水平、曲目技巧和难度三个核心方面。数据集的创建过程包括从YouTube收集录音并进行专业标注，确保了数据的质量和多样性。PLD主要应用于音乐教育和表演分析领域，旨在提高机器对钢琴演奏技巧和表现水平的理解能力。

The Pianism-Labelling Dataset (PLD) is a large-scale dataset developed by the Digital Music Centre at Queen Mary University of London, focusing on the expressive understanding of Western classical piano solo music. This dataset contains 136 hours of audio recordings and detailed annotations, covering three core dimensions: professional performance proficiency, repertoire techniques, and performance difficulty. The construction of PLD involves collecting audio recordings from YouTube and conducting professional annotations, which ensures the quality and diversity of the dataset. PLD is primarily applied in the fields of music education and performance analysis, aiming to enhance machines' understanding of piano performance techniques and expressive levels.

提供机构：

数字音乐中心，伦敦玛丽女王大学

创建时间：

2024-07-05

原始信息汇总

数据集概述

标题

Tuning Audio Encoders to be Piano Judges

描述

该数据集用于训练音频编码器，使其能够作为钢琴评判工具。

内容

数据集包含钢琴演奏的音频样本，用于训练模型识别和评估钢琴演奏的质量。

使用场景

适用于开发和训练音频处理模型，特别是在音乐评判和分析领域。

技术细节

数据集提供了丰富的音频数据，支持深度学习模型的训练和验证。

相关资源

数据集详情页面提供了进一步的技术文档和使用指南。

搜集汇总

数据集介绍

构建方式

Pianism-Labelling Dataset (PLD) 的构建基于对独奏西方古典钢琴音乐的音频编码模型研究。该数据集通过整合来自 YouTube 和 ATEPP 等数据源的独奏钢琴录音，并由两位大学钢琴学生进行验证，确保了数据的质量和准确性。数据集包括三个核心任务的标注：专家水平排名、难度估计和钢琴技巧检测。每个录音都根据其演奏者的背景和演奏水平进行了细致的分类，从而为机器学习模型提供了丰富的训练数据。

特点

PLD 数据集的显著特点在于其针对独奏钢琴音乐的细致标注和多任务设计。数据集不仅涵盖了从初学者到著名钢琴家的广泛演奏水平，还详细标注了演奏技巧和曲目难度，为研究者提供了多维度的音乐表现理解。此外，数据集的构建过程中采用了多种预训练音频编码器，如 Jukebox、Audio-MAE、MERT 和 DAC，以探索这些模型在捕捉演奏细节方面的能力。

使用方法

PLD 数据集适用于多种音乐信息检索和机器学习任务，特别是那些需要深入理解钢琴演奏表现的任务。研究者可以通过该数据集训练模型进行专家水平排名、难度估计和技巧检测。使用方法包括加载数据集、选择合适的音频编码器进行特征提取，以及设计相应的预测模型进行训练和评估。数据集的详细标注和多任务设计使其成为研究音乐表现理解和教育应用的宝贵资源。

背景与挑战

背景概述

在音乐信息检索领域，传统的研究主要集中在音乐作品层面的属性理解，如调性、节奏、风格和乐器配置等。然而，人类音乐活动的大部分时间并非专注于已创作的歌曲或乐曲本身，而是集中在学习和演奏这些作品的过程中。尽管演奏技巧、技能多样性、风格差异和难度分级等表演层面的音乐理解对学生、教师和音乐家具有重要意义，但机器尚未完全掌握这些细微差别。Pianism-Labelling Dataset (PLD) 由伦敦大学玛丽皇后学院数字音乐中心的研究团队创建，旨在填补这一知识空白。该数据集专注于独奏西方古典钢琴音乐的表演理解，通过预训练的音频编码器模型，如Jukebox、Audio-MAE、MERT和DAC，探索是否可以通过领域特定的微调来增强捕捉表演细微差别的能力。

当前挑战

PLD数据集面临的挑战包括：1) 解决领域问题的挑战，如在图像分类中，ImageNet数据集解决了图像分类的问题。PLD数据集旨在解决独奏钢琴音乐的表演理解问题，包括专家排名、难度估计和钢琴技巧检测。2) 构建过程中遇到的挑战，如数据稀缺、任务模糊和建模与表现中表达元素的内在复杂性。此外，尽管统一表示和基础模型在多个领域提供了强大且多功能的框架，但其在表演理解领域的应用仍需进一步探索。

常用场景

经典使用场景

Pianism-Labelling Dataset (PLD) 在钢琴演奏理解领域中，主要用于三个经典任务：专家水平排名、难度估计和钢琴技巧检测。通过利用预训练的音频编码器，如 Jukebox、Audio-MAE、MERT 和 DAC，该数据集能够有效捕捉演奏中的细微差别，从而实现对演奏者技能水平的精确评估。

解决学术问题

PLD 数据集填补了音乐表演理解领域的知识空白，解决了传统音乐理解任务中对演奏水平理解的不足。它通过提供详细的标注数据，支持专家水平排名、难度估计和钢琴技巧检测等任务，推动了音乐信息检索和自动音乐表演评估的发展，为音乐教育和表演分析提供了新的研究方向。

衍生相关工作

基于 PLD 数据集的研究衍生了一系列相关工作，包括使用预训练音频编码器进行域适应的研究，以及在 Chopin 钢琴比赛数据上的应用案例。这些工作不仅验证了数据集的有效性，还推动了音乐表演理解领域的技术进步，为未来的多任务学习和对比学习提供了新的思路。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集