MASTmelody_dataset

github2023-07-25 更新2024-05-31 收录

下载链接：

https://github.com/ekinakyurek/MASTmelody_dataset

下载链接

链接失效反馈

官方服务：

资源简介：

MASTmelody数据集旨在促进自动音乐表演评估领域的算法比较。该数据集包含从音乐学院入学考试期间录制的音频数据中提取的音高（f0）数据。数据分为两类：参考录音文件的f0数据（作为参考的钢琴旋律）和表演录音文件的f0数据（候选人演唱旋律的录音）。每个录音都使用Melodia旋律提取工具的变体进行了f0检测，并将结果保存为包含时间戳和估计f0信息的文本文件。表演由三名评审团成员评分，评分结果为二进制：通过或失败。数据集仅包括所有评审团成员一致评分的样本。

The MASTmelody dataset is designed to facilitate algorithmic comparisons in the field of automated music performance evaluation. This dataset comprises pitch (f0) data extracted from audio recordings made during music conservatory entrance exams. The data is categorized into two types: f0 data from reference recordings (piano melodies serving as references) and f0 data from performance recordings (recordings of candidates singing the melodies). Each recording underwent f0 detection using a variant of the Melodia melody extraction tool, with the results saved as text files containing timestamps and estimated f0 information. Performances were scored by a panel of three judges, with binary outcomes: pass or fail. The dataset includes only those samples where all judges unanimously agreed on the score.

创建时间：

2017-07-26

原始信息汇总

数据集概述

数据集名称

MASTmelody_dataset

数据集内容

f0-series数据：从歌唱和钢琴样本中计算得出的f0数据。
基准系统：用于评估歌唱样本与参考钢琴录音的基准系统。

数据集结构

baseline：基准模型的代码，详细文档见baseline/README.md。
f0data：MASTmelody数据集。
wavSamples：音频样本。

数据集特点

数据集包含两类f0数据：
- 参考录音文件的f0数据（钢琴演奏的旋律）。
- 表演录音文件的f0数据（候选人歌唱旋律的录音）。
数据集中的表演已由三位评审成员（音乐学院的教职员工）进行评分，评分结果为二元：通过或未通过。
数据集仅包含所有评审成员一致同意的评分样本。

命名规则

文件名包含以下信息：
- ref：钢琴参考录音。
- per：表演录音。
- fail：评审评为未通过的表演。
- pass：评审评为通过的表演。
文件名示例：
- 51_mel1_per101559_fail.f0s.txt：ID为51_mel1的旋律，表演文件，评审评为未通过。
- 55_mel2_ref280758.f0s.txt：ID为55_mel2的旋律，参考文件。

许可证

本数据集根据Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License授权。

致谢

本数据集是在土耳其科学技术研究委员会（TUBITAK）资助的研究项目1001-215K017下开发的，旨在开发音乐表演的自动评估工具。

搜集汇总

数据集介绍

构建方式

MASTmelody数据集的构建基于音乐学院入学考试中的音频数据，通过提取音频中的基频（f0）信息生成。由于音频文件的匿名化难度较大，数据集仅包含经过处理的f0数据，而非原始音频。f0数据通过Melodia旋律提取工具的变体进行计算，结果以文本文件形式保存，包含时间戳和估计的基频信息。数据集中的每段录音均由三位评审进行评分，评分结果为通过或未通过，且仅包含所有评审意见一致的样本。

特点

MASTmelody数据集的特点在于其专注于音乐表演的自动评估领域，提供了钢琴参考录音和演唱表演录音的f0数据。数据集的命名规则清晰，文件名中编码了旋律ID、录音类型（参考或表演）以及评分结果（通过或未通过）。数据集包含40首不同的旋律，每首旋律均有参考录音和表演录音的f0数据，且表演录音的评分结果分为两类：全部评审通过的样本和全部评审未通过的样本。

使用方法

MASTmelody数据集的使用方法主要包括加载和处理f0数据文件，以及利用提供的基线系统进行算法比较。用户可以通过文件名解析获取旋律ID、录音类型和评分结果等信息。数据集附带了一个基线系统，用于比较演唱样本与参考钢琴录音的相似性。用户可通过运行基线系统代码，评估自己的算法在音乐表演自动评估任务中的表现。使用该数据集时，需引用相关论文以尊重作者的知识产权。

背景与挑战

背景概述

MASTmelody_dataset数据集由Bozkurt、Baysal和Yuret等研究人员于2017年创建，旨在为自动音乐表演评估领域提供算法比较的基础。该数据集基于音乐学院入学考试中的音频数据，提取了基频（f0）信息，并提供了参考钢琴录音和考生演唱录音的f0数据。数据集的设计初衷是为了解决音乐表演评估中的自动化问题，特别是在演唱与参考录音之间的对比分析上。该数据集在计算机音乐多学科研究领域具有重要影响力，为后续研究提供了宝贵的数据资源。

当前挑战

MASTmelody_dataset面临的挑战主要集中在两个方面。首先，数据集的核心任务是解决演唱与参考录音之间的自动对比评估问题，这要求算法能够精确捕捉演唱中的音高偏差和表现差异，同时克服音频数据中可能存在的噪声和失真问题。其次，在数据集的构建过程中，研究人员面临了音频数据匿名化的难题，由于音频文件可能泄露演唱者的身份信息，最终仅提供了少量样本。此外，数据集的标注依赖于三位评审的一致评分，这可能导致数据样本的局限性，尤其是在评分不一致的情况下，相关数据被排除在外，进一步限制了数据集的规模和多样性。

常用场景

经典使用场景

MASTmelody数据集在音乐信息检索和自动音乐评估领域具有广泛的应用。该数据集通过提供从钢琴演奏和歌唱样本中提取的f0序列数据，为研究者提供了一个标准化的平台，用于开发和测试自动评估歌唱表现的算法。数据集中的参考录音和表演录音的f0数据，使得研究者能够进行精确的对比分析，从而评估歌唱者的音准和表现力。

实际应用

在实际应用中，MASTmelody数据集被广泛用于音乐教育和技术开发。例如，音乐学校可以利用该数据集中的f0数据，开发自动化的歌唱评估系统，帮助学生在没有教师指导的情况下进行自我评估。此外，该数据集还可用于开发智能音乐助手，帮助用户实时调整歌唱音准，提升音乐表现力。

衍生相关工作

基于MASTmelody数据集，许多经典的研究工作得以展开。例如，研究者开发了多种音高检测算法，用于提高自动评估系统的准确性。此外，该数据集还促进了音乐信息检索领域的研究，推动了基于机器学习的音乐分析技术的发展。这些工作不仅丰富了音乐信息检索的理论体系，还为实际应用提供了有力的技术支持。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集