ASAP
收藏github2024-05-24 更新2024-05-31 收录
下载链接:
https://github.com/fosfrancesco/asap-dataset
下载链接
链接失效反馈官方服务:
资源简介:
ASAP是一个包含对齐的音乐乐谱(MIDI和MusicXML)和表演(音频和MIDI)的数据集,所有内容都带有强拍、拍子、时间签名和键签名注释。该数据集包含236个不同的音乐乐谱和1067个西方古典钢琴音乐表演,涵盖15位不同作曲家的作品。
ASAP is a dataset comprising aligned musical scores (MIDI and MusicXML) and performances (audio and MIDI), all annotated with strong beats, tempo, time signatures, and key signatures. The dataset includes 236 distinct musical scores and 1067 performances of Western classical piano music, featuring works by 15 different composers.
创建时间:
2020-07-13
原始信息汇总
ASAP数据集概述
数据集内容
- 音乐作品数量: 236首独特的乐谱
- 表演数量: 1067个表演
- 音乐类型: 西方古典钢琴音乐
- 作曲家数量: 15位
数据集格式
- 乐谱格式: MIDI和MusicXML
- 表演格式: 音频和MIDI
- 注释格式: TSV文件和JSON文件
数据集结构
- 文件夹结构:
composer/subgroup/piece,其中piece目录包含XML和MIDI乐谱以及特定作品的所有表演。 - 元数据文件:
metadata.csv,包含文件对应关系、作品标题和作曲家信息。 - 注释文件:
{basename(file)}_annotations.txt,用于在Audacity中查看对应音频表演的注释。
注释内容
- TSV注释: 包含每个表演和MIDI乐谱的节拍、强拍、时间签名变化和键签名变化的秒位置。
- JSON注释: 包含所有文件的注释信息,包括表演节拍、强拍、时间签名和键签名。
数据集使用
- 获取音频文件: 需要下载Maestro数据集v2.0.0并运行
python initialize_dataset.py。 - 数据集引用: 使用此数据集进行研究时,请引用相关论文。
数据集限制
- 乐谱质量: 由非专业人士编写,建议使用提供的修正注释。
- 表演与乐谱对齐: 31个表演未与乐谱对齐,但仍可用于节拍/强拍跟踪。
许可证
搜集汇总
数据集介绍

构建方式
ASAP数据集的构建基于对齐的音乐乐谱(包括MIDI和MusicXML格式)与演奏(音频和MIDI),并附有节拍、拍号和调号注释。数据集通过整合来自Maestro数据集的音频文件,并使用Python脚本进行初始化,确保了音频与乐谱之间的高精度对齐。此外,数据集中的每个乐谱都提供了MusicXML和MIDI两种格式,MIDI事件的位置根据MusicXML乐谱中的位置进行了量化,确保了乐谱与演奏之间的一致性。
特点
ASAP数据集的显著特点在于其高精度的对齐性能,音频与MIDI演奏的对齐精度约为3毫秒。此外,数据集包含了236个独特的乐谱和1067个演奏,涵盖了15位西方古典钢琴作曲家的作品。每个乐谱和演奏都附有详细的注释,包括节拍、拍号和调号的变化,这些注释以TSV和JSON格式提供,便于进一步分析和处理。
使用方法
使用ASAP数据集时,用户可以通过下载Maestro数据集并运行提供的Python脚本来获取音频文件。数据集的元数据CSV文件和注释JSON文件提供了详细的文件对应关系和注释信息,便于用户进行数据检索和分析。例如,用户可以通过读取metadata.csv文件来获取特定乐谱或演奏的路径,并通过asap_annotations.json文件获取详细的注释信息,包括节拍、拍号和调号的变化。
背景与挑战
背景概述
ASAP数据集,全称为Aligned Scores and Performances,由Francesco Foscarin、Andrew McLeod、Philippe Rigaux、Florent Jacquemard和Masahiko Sakai于2020年创建。该数据集专注于音乐信息检索(MIR)领域,特别是钢琴转录任务。ASAP包含了236个独特的乐谱和1067个演奏,涵盖了15位西方古典钢琴作曲家的作品。这些乐谱和演奏不仅包括MIDI和MusicXML格式,还附有节拍、拍号和调号等详细注释。ASAP的创建旨在解决音乐转录中的对齐问题,为研究人员提供了一个丰富的资源,以探索和改进音乐信息检索技术。
当前挑战
ASAP数据集在构建过程中面临多项挑战。首先,乐谱由非专业人士编写,尽管经过手动校正,仍存在一些错误。其次,某些复杂音乐元素(如中间的弱起拍、自由节奏的乐段和复杂的装饰音)难以从乐谱中确定节拍位置。此外,31个演奏未能与乐谱完全对齐,主要由于演奏不完整或演奏者失误。尽管这些演奏不适用于自动音乐转录和乐谱生成,但仍可用于节拍/强拍跟踪任务。最后,ASAP主要针对节拍/强拍跟踪、调号估计和拍号估计等MIR任务,尚未探索其他任务如声部分离、连音/三连音创建和表现性演奏渲染。
常用场景
经典使用场景
ASAP数据集在音乐信息检索(MIR)领域中被广泛用于音乐转录任务。其经典使用场景包括从音频中提取音乐符号,生成与乐谱对齐的MIDI文件,以及进行节奏和节拍跟踪。通过将MIDI和MusicXML格式的乐谱与音频和MIDI表演对齐,研究人员能够精确地分析和比较不同表演之间的差异,从而推动音乐转录技术的发展。
实际应用
在实际应用中,ASAP数据集被用于开发和验证音乐转录软件,这些软件能够将现场演奏或录音转换为乐谱。此外,该数据集还支持音乐教育和音乐治疗领域,通过提供精确的乐谱和表演对齐信息,帮助学生和治疗师更好地理解和分析音乐作品。
衍生相关工作
ASAP数据集的发布激发了大量相关研究工作,包括基于深度学习的音乐转录模型、节奏和节拍跟踪算法、以及音乐风格分析和生成模型。这些研究不仅提升了音乐信息检索技术的水平,还推动了音乐教育和音乐创作工具的创新发展。
以上内容由遇见数据集搜集并总结生成



