GigaMIDI Dataset with Features for Expressive Music Performance Detection
收藏arXiv2025-02-25 更新2025-02-27 收录
下载链接:
http://arxiv.org/abs/2502.17726v1
下载链接
链接失效反馈官方服务:
资源简介:
GigaMIDI数据集是由国际音乐信息检索学会提供的一个包含超过143万首独特的MIDI文件的数据集,涵盖18亿个MIDI音符事件和超过530万条MIDI音轨。这是目前可供研究使用的最大的符号音乐集合。该数据集旨在通过创新的启发式方法,检测表达性音乐表演,以区分非表达性和表达性MIDI音轨。
The GigaMIDI dataset, provided by the International Society for Music Information Retrieval (ISMIR), contains over 1.43 million unique MIDI files, covering 1.8 billion MIDI note events and more than 5.3 million MIDI tracks. It is currently the largest symbolic music corpus available for research use. This dataset aims to detect expressive musical performances via innovative heuristic methods to distinguish between non-expressive and expressive MIDI tracks.
提供机构:
国际音乐信息检索学会
创建时间:
2025-02-25
搜集汇总
数据集介绍

构建方式
GigaMIDI 数据集的构建方式是通过从网络上收集大量的 MIDI 文件,并进行清洗和预处理。这些 MIDI 文件来自多个公共数据集和网页,包括 Zenodo、GitHub 和公共 MIDI 存储库。在收集过程中,数据集的创建者手动检查每个文件,以确保其适合用于音乐表现检测。此外,数据集还包括手动注释的音乐风格元数据,以便更好地理解音乐结构和风格。为了提高数据集的可用性,GigaMIDI 数据集托管在 Hugging Face Hub 上,并提供了 Python 库 Symusic 和 MidiTok 的支持,以便于 MIDI 解析和符号音乐处理。
特点
GigaMIDI 数据集的特点是其规模庞大,包含超过 140 万个独特的 MIDI 文件,1.8 亿个 MIDI 笔记事件和 530 多万个 MIDI 轨道。这使得 GigaMIDI 成为迄今为止最大的符号音乐集合,可用于音乐信息检索和音乐数据挖掘研究。此外,数据集还包括手动注释的音乐风格元数据,以及用于检测音乐表现的创新启发式算法。这些启发式算法包括独特的音符速度比率 (DNVR) 和独特的音符起始偏差比率 (DNODR),以及音符起始中位数度量水平 (NOMML),这些算法可以有效地区分非表现性和表现性 MIDI 轨道。
使用方法
GigaMIDI 数据集的使用方法包括音乐信息检索和音乐数据挖掘。数据集可以用于研究音乐理解、计算音乐学、生成音乐以及音乐表现检测等领域。启发式算法可用于识别表现性 MIDI 轨道,并帮助研究人员分析音乐表现的特征和风格。此外,数据集的可用性使其成为音乐研究人员的宝贵资源,可以促进对音乐表现和生成的研究。
背景与挑战
背景概述
GigaMIDI数据集是一个包含超过140万个独特MIDI文件的集合,这些文件包含18亿个MIDI音符事件和超过530万个MIDI轨道。该数据集由Keon Ju Maverick Lee、Jeff Ens、Sara Adkins、Pedro Sarmento、Mathieu Barthet和Philippe Pasquier于2025年创建,旨在促进对音乐理解、计算音乐学和生成音乐的研究。GigaMIDI是目前可用的最大的MIDI格式的符号音乐集合之一,它为研究人员提供了宝贵的资源,用于分析音乐趋势和风格。此外,该数据集还引入了一套创新的启发式方法,用于检测富有表现力的音乐表演,包括区分非表现力和表现力MIDI轨道的启发式方法。这些启发式方法包括独特音符速度比率(DNVR)、独特音符开始偏差比率(DNODR)和音符开始中值度量水平(NOMML)。通过这些启发式方法,研究人员可以有效地分析MIDI轨道的表现力,这对于音乐信息检索、计算音乐学和生成音乐等领域具有重要意义。
当前挑战
尽管GigaMIDI数据集为音乐研究提供了宝贵的资源,但它在构建过程中也面临了一些挑战。首先,区分非表现力和表现力MIDI轨道是一个挑战,因为MIDI文件本身并不包含这种区分的元数据。其次,构建过程中遇到的另一个挑战是缺乏区分所有MIDI乐器中非表现力和表现力MIDI轨道的可靠地面真实数据。此外,GigaMIDI数据集中的乐器分布存在偏差,其中钢琴和鼓的比例较高,而其他乐器的代表性不足。这可能导致对某些音乐风格的偏见,并限制数据集的广泛应用。最后,MIDI标准在编码西方音乐的复杂时间结构和度量变化方面存在局限性,这需要补充元数据或高级技术来准确捕捉音乐细节。为了克服这些挑战,研究人员需要开发新的启发式方法,以更准确地检测MIDI轨道的表现力,并收集更全面的地面真实数据。此外,为了提高数据集的适用性,需要减少西方音乐偏差,并增加对非西方音乐的支持。
常用场景
经典使用场景
GigaMIDI数据集被广泛用于音乐信息检索(MIR)研究,特别是在音乐理解和计算音乐学领域。它为研究人员提供了丰富的MIDI文件资源,这些文件包含音乐指令,可以用于研究音乐的风格、趋势和结构。此外,GigaMIDI数据集还特别适用于生成性音乐研究,因为它包含了大量的符号音乐数据,可以用于训练和测试音乐生成模型。该数据集还包含了音乐风格的元数据,这有助于研究人员进行音乐风格分类、情感分类和音乐作品匹配等任务。
解决学术问题
GigaMIDI数据集解决了MIDI文件中缺乏表达性音乐表演区分的问题。MIDI文件通常不包含区分非表达性和表达性表演的元数据,这使得研究音乐表达性变得困难。通过引入一系列创新启发式算法,如DNVR、DNODR和NOMML,GigaMIDI数据集能够有效地区分非表达性和表达性MIDI轨道。这使得研究人员能够更深入地研究音乐表演中的表达性元素,并为生成性音乐研究提供了更准确的数据集。
衍生相关工作
GigaMIDI数据集的发布引发了一系列相关研究。例如,研究人员利用GigaMIDI数据集开发了一种新的启发式算法,用于检测MIDI轨道中的表达性音乐表演。这些算法可以帮助研究人员更好地理解和分析音乐表达性,并为音乐生成和音乐风格分类等任务提供更准确的数据集。此外,GigaMIDI数据集还促进了音乐信息检索和计算音乐学领域的国际合作,为研究人员提供了一个共同的数据资源平台。
以上内容由遇见数据集搜集并总结生成



