ARIA-MIDI
收藏arXiv2025-04-21 更新2025-04-23 收录
下载链接:
https://github.com/loubbrad/aria-midi
下载链接
链接失效反馈官方服务:
资源简介:
ARIA-MIDI是由伦敦玛丽女王大学创建的一个包含超过一百万个MIDI文件的钢琴音乐数据集。这些MIDI文件是通过将网络上的钢琴演奏音频转录成音符而创建的。数据集涵盖了大约10万小时的转录音频,旨在为符号音乐建模提供高质量的数据资源。
ARIA-MIDI is a piano music dataset containing over one million MIDI files, created by Queen Mary University of London. These MIDI files are generated by transcribing piano performance audio from the web into musical notes. The dataset spans approximately 100,000 hours of transcribed audio, aiming to provide high-quality data resources for symbolic music modeling.
提供机构:
伦敦玛丽女王大学
创建时间:
2025-04-21
搜集汇总
数据集介绍

构建方式
ARIA-MIDI数据集的构建采用多阶段流水线技术,通过语言模型自主爬取互联网钢琴演奏音频并依据元数据进行评分,随后运用音频分类器进行筛选与分段处理。该方法创新性地结合了自然语言处理与音频分析技术,实现了从海量网络资源中高效提取高质量钢琴演奏数据。最终生成的MIDI文件库包含超过100万条独立转录样本,总时长约10万小时,代表了当前自动化音乐转录领域的最先进水平。
特点
该数据集最显著的特点是规模宏大且质量精良,其转录内容完整保留了原始演奏的细微表现力特征。相较于同类数据集,ARIA-MIDI通过先进的音频分类算法实现了8倍的非钢琴音频识别提升,并附带了精确的作曲元数据标签。特别值得注意的是,数据集涵盖了从古典到现代多种音乐风格,且每份转录文件均包含演奏质量评分指标,为音乐信息检索研究提供了丰富的结构化数据支持。
使用方法
研究者可通过GitHub仓库获取数据集完整包,其中包含标准MIDI文件及配套元数据。使用建议包括:利用质量评分指标创建定制化数据子集;参考作曲元数据进行风格化音乐生成实验;将转录结果作为预训练模型的输入数据。数据集采用CC-BY-NC-SA许可协议,特别适合符号音乐建模、自动作曲系统开发等研究场景,但需注意不包含原始音频文件以遵守版权规范。
背景与挑战
背景概述
ARIA-MIDI是由伦敦玛丽女王大学的研究团队于2025年推出的一个大规模钢琴MIDI数据集,旨在推动符号音乐建模领域的研究。该数据集通过创新的多阶段数据处理流程,将网络上的钢琴演奏音频转录为MIDI文件,最终包含超过100万首MIDI文件,约10万小时的转录音频。ARIA-MIDI的推出填补了符号音乐数据集中质量与规模难以兼顾的空白,为音乐信息检索(MIR)和生成式音乐模型的研究提供了重要资源。其核心研究问题聚焦于如何通过自动化技术高效处理海量音频数据,并生成高质量的符号音乐表示。
当前挑战
ARIA-MIDI面临的挑战主要包括两方面:1) 领域问题挑战:符号音乐建模需要处理音乐的结构复杂性和表现力多样性,尤其是在转录钢琴演奏时,需准确捕捉音符、力度和节奏等细节。现有数据集如MAESTRO虽质量高但规模有限,而Lakh数据集规模大但质量参差不齐。2) 构建过程挑战:自动音乐转录(AMT)技术在处理不同音色和录音质量时表现不稳定,且音频分类与分割需在无人工干预下高效过滤非钢琴内容。此外,如何从嘈杂的网络音频中提取准确的元数据,并避免作品重复,也是数据集构建中的关键难题。
常用场景
经典使用场景
在计算音乐学领域,ARIA-MIDI数据集为符号音乐建模研究提供了丰富的资源。该数据集通过自动音乐转录技术将钢琴演奏音频转化为MIDI文件,涵盖了古典、爵士等多种音乐风格。研究者可利用其百万量级的MIDI文件,探索音乐生成、音乐信息检索等方向,尤其在基于Transformer架构的钢琴转录模型开发中展现出独特价值。数据集的结构化设计支持对音符起始、持续时间和力度等音乐要素的细粒度分析。
衍生相关工作
该数据集已催生系列重要研究成果,包括基于Whisper架构的Aria-AMT转录模型,其在MAESTRO测试集上取得97.63%的F1分数。在音乐生成领域,研究者利用数据集训练出首个支持踏板控制的seq2seq钢琴转录系统。此外,数据集启发了音乐源分离技术的创新应用,如MVSep钢琴分离模型在伪标签生成中的突破性使用。这些衍生工作共同推动了符号音乐处理技术向更高精度、更强鲁棒性发展。
数据集最近研究
最新研究方向
近年来,ARIA-MIDI数据集在符号音乐建模领域引起了广泛关注,特别是在钢琴音乐转录和生成方面。该数据集通过自动音乐转录(AMT)技术,将大量钢琴演奏音频转化为MIDI文件,为音乐信息检索(MIR)和生成模型的研究提供了丰富的数据支持。前沿研究方向包括利用大规模预训练模型进行音乐生成、多乐器转录技术的扩展,以及通过语言模型优化元数据提取和实体识别。ARIA-MIDI的发布填补了高质量、大规模符号音乐数据集的空白,为音乐人工智能领域的研究提供了新的可能性。
相关研究论文
- 1Aria-MIDI: A Dataset of Piano MIDI Files for Symbolic Music Modeling伦敦玛丽女王大学 · 2025年
以上内容由遇见数据集搜集并总结生成



