five

ASAP|音乐分析数据集|乐谱识别数据集

收藏
github2024-05-24 更新2024-05-31 收录
音乐分析
乐谱识别
下载链接:
https://github.com/fosfrancesco/asap-dataset
下载链接
链接失效反馈
资源简介:
ASAP是一个包含对齐的音乐乐谱(MIDI和MusicXML)和表演(音频和MIDI)的数据集,所有内容都带有强拍、拍子、时间签名和键签名注释。该数据集包含236个不同的音乐乐谱和1067个西方古典钢琴音乐表演,涵盖15位不同作曲家的作品。

ASAP is a dataset comprising aligned musical scores (MIDI and MusicXML) and performances (audio and MIDI), all annotated with strong beats, tempo, time signatures, and key signatures. The dataset includes 236 distinct musical scores and 1067 performances of Western classical piano music, featuring works by 15 different composers.
创建时间:
2020-07-13
原始信息汇总

ASAP数据集概述

数据集内容

  • 音乐作品数量: 236首独特的乐谱
  • 表演数量: 1067个表演
  • 音乐类型: 西方古典钢琴音乐
  • 作曲家数量: 15位

数据集格式

  • 乐谱格式: MIDI和MusicXML
  • 表演格式: 音频和MIDI
  • 注释格式: TSV文件和JSON文件

数据集结构

  • 文件夹结构: composer/subgroup/piece,其中piece目录包含XML和MIDI乐谱以及特定作品的所有表演。
  • 元数据文件: metadata.csv,包含文件对应关系、作品标题和作曲家信息。
  • 注释文件: {basename(file)}_annotations.txt,用于在Audacity中查看对应音频表演的注释。

注释内容

  • TSV注释: 包含每个表演和MIDI乐谱的节拍、强拍、时间签名变化和键签名变化的秒位置。
  • JSON注释: 包含所有文件的注释信息,包括表演节拍、强拍、时间签名和键签名。

数据集使用

  • 获取音频文件: 需要下载Maestro数据集v2.0.0并运行python initialize_dataset.py
  • 数据集引用: 使用此数据集进行研究时,请引用相关论文。

数据集限制

  • 乐谱质量: 由非专业人士编写,建议使用提供的修正注释。
  • 表演与乐谱对齐: 31个表演未与乐谱对齐,但仍可用于节拍/强拍跟踪。

许可证

AI搜集汇总
数据集介绍
main_image_url
构建方式
ASAP数据集的构建基于对齐的音乐乐谱(包括MIDI和MusicXML格式)与演奏(音频和MIDI),并附有节拍、拍号和调号注释。数据集通过整合来自Maestro数据集的音频文件,并使用Python脚本进行初始化,确保了音频与乐谱之间的高精度对齐。此外,数据集中的每个乐谱都提供了MusicXML和MIDI两种格式,MIDI事件的位置根据MusicXML乐谱中的位置进行了量化,确保了乐谱与演奏之间的一致性。
特点
ASAP数据集的显著特点在于其高精度的对齐性能,音频与MIDI演奏的对齐精度约为3毫秒。此外,数据集包含了236个独特的乐谱和1067个演奏,涵盖了15位西方古典钢琴作曲家的作品。每个乐谱和演奏都附有详细的注释,包括节拍、拍号和调号的变化,这些注释以TSV和JSON格式提供,便于进一步分析和处理。
使用方法
使用ASAP数据集时,用户可以通过下载Maestro数据集并运行提供的Python脚本来获取音频文件。数据集的元数据CSV文件和注释JSON文件提供了详细的文件对应关系和注释信息,便于用户进行数据检索和分析。例如,用户可以通过读取metadata.csv文件来获取特定乐谱或演奏的路径,并通过asap_annotations.json文件获取详细的注释信息,包括节拍、拍号和调号的变化。
背景与挑战
背景概述
ASAP数据集,全称为Aligned Scores and Performances,由Francesco Foscarin、Andrew McLeod、Philippe Rigaux、Florent Jacquemard和Masahiko Sakai于2020年创建。该数据集专注于音乐信息检索(MIR)领域,特别是钢琴转录任务。ASAP包含了236个独特的乐谱和1067个演奏,涵盖了15位西方古典钢琴作曲家的作品。这些乐谱和演奏不仅包括MIDI和MusicXML格式,还附有节拍、拍号和调号等详细注释。ASAP的创建旨在解决音乐转录中的对齐问题,为研究人员提供了一个丰富的资源,以探索和改进音乐信息检索技术。
当前挑战
ASAP数据集在构建过程中面临多项挑战。首先,乐谱由非专业人士编写,尽管经过手动校正,仍存在一些错误。其次,某些复杂音乐元素(如中间的弱起拍、自由节奏的乐段和复杂的装饰音)难以从乐谱中确定节拍位置。此外,31个演奏未能与乐谱完全对齐,主要由于演奏不完整或演奏者失误。尽管这些演奏不适用于自动音乐转录和乐谱生成,但仍可用于节拍/强拍跟踪任务。最后,ASAP主要针对节拍/强拍跟踪、调号估计和拍号估计等MIR任务,尚未探索其他任务如声部分离、连音/三连音创建和表现性演奏渲染。
常用场景
经典使用场景
ASAP数据集在音乐信息检索(MIR)领域中被广泛用于音乐转录任务。其经典使用场景包括从音频中提取音乐符号,生成与乐谱对齐的MIDI文件,以及进行节奏和节拍跟踪。通过将MIDI和MusicXML格式的乐谱与音频和MIDI表演对齐,研究人员能够精确地分析和比较不同表演之间的差异,从而推动音乐转录技术的发展。
实际应用
在实际应用中,ASAP数据集被用于开发和验证音乐转录软件,这些软件能够将现场演奏或录音转换为乐谱。此外,该数据集还支持音乐教育和音乐治疗领域,通过提供精确的乐谱和表演对齐信息,帮助学生和治疗师更好地理解和分析音乐作品。
衍生相关工作
ASAP数据集的发布激发了大量相关研究工作,包括基于深度学习的音乐转录模型、节奏和节拍跟踪算法、以及音乐风格分析和生成模型。这些研究不仅提升了音乐信息检索技术的水平,还推动了音乐教育和音乐创作工具的创新发展。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国区域交通网络数据集

该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。

data.stats.gov.cn 收录

中国1km分辨率逐月降水量数据集(1901-2023)

该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2023.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。

国家青藏高原科学数据中心 收录

TCIA

TCIA(The Cancer Imaging Archive)是一个公开的癌症影像数据集,包含多种癌症类型的医学影像数据,如CT、MRI、PET等。这些数据通常与临床和病理信息相结合,用于癌症研究和临床试验。

www.cancerimagingarchive.net 收录

Student Score Dataset

这是一个关于不同族裔学生成绩的数据集,涵盖了多个学科的成绩分析。

github 收录

UAVDT

UAVDT数据集由中国科学院大学等机构创建,包含约80,000帧从10小时无人机拍摄视频中精选的图像,覆盖多种复杂城市环境。数据集主要关注车辆目标,每帧均标注了边界框及多达14种属性,如天气条件、飞行高度、相机视角等。该数据集旨在推动无人机视觉技术在不受限制场景下的研究,解决高密度、小目标、相机运动等挑战,适用于物体检测、单目标跟踪和多目标跟踪等基础视觉任务。

arXiv 收录