Piano Roll, Lead Sheets, Midi
收藏github2022-01-15 更新2024-05-31 收录
下载链接:
https://github.com/tengyifei/Symbolic-Musical-Datasets
下载链接
链接失效反馈官方服务:
资源简介:
该仓库收集了多种符号音乐数据集,包括钢琴滚动数据集、领唱数据集和MIDI数据集,每个数据集都有其特定的来源和格式。
This repository compiles a variety of symbolic music datasets, including piano roll datasets, lead sheet datasets, and MIDI datasets, each with its specific sources and formats.
创建时间:
2018-12-02
原始信息汇总
搜集汇总
数据集介绍

构建方式
该数据集通过整合多个来源的符号音乐数据构建而成,涵盖了钢琴卷帘、主旋律谱和MIDI格式的音乐数据。具体而言,钢琴卷帘数据集来源于Lakh钢琴卷帘数据集,并采用了新的预处理策略;主旋律谱数据集则从Theorytab等平台爬取,并结合了其他主旋律谱数据集的潜力;MIDI数据集则从VGMdb、Doug McKenzie Jazz等多个来源收集,涵盖了游戏、爵士和古典音乐等多种风格。
特点
该数据集的特点在于其多样性和广泛性,涵盖了多种音乐风格和格式。钢琴卷帘数据集提供了多轨钢琴卷帘数据,便于音乐生成和分析;主旋律谱数据集包含旋律和和弦信息,适合用于音乐理论和创作研究;MIDI数据集则提供了丰富的多轨MIDI文件,适用于音乐信息检索和自动作曲等任务。此外,数据集还提供了详细的元数据信息,如音乐风格、格式和来源,便于用户进行进一步的分析和应用。
使用方法
该数据集的使用方法灵活多样,用户可以根据需求选择不同的子数据集进行下载和使用。对于钢琴卷帘数据集,用户可以通过提供的预处理代码进行数据清洗和转换;主旋律谱数据集则可以通过XML格式进行解析,提取旋律和和弦信息;MIDI数据集则可以直接用于音乐生成、分析和检索任务。此外,数据集还提供了相关的工具和代码,帮助用户进行数据的爬取和处理,进一步扩展数据集的应用范围。
背景与挑战
背景概述
Piano Roll, Lead Sheets, Midi数据集是一个专注于符号音乐数据的集合,旨在为音乐信息检索、自动作曲和音乐分析等领域提供丰富的资源。该数据集由多个子集构成,包括五轨钢琴卷数据集、主旋律与和弦数据集以及MIDI格式的音乐数据。这些数据主要来源于Lakh Pianoroll Dataset、Theorytab、Wikifonia等公开资源,涵盖了流行、爵士、古典等多种音乐风格。该数据集的创建时间为近年,主要研究人员和机构包括Wayne391等开源贡献者。其核心研究问题在于如何通过符号音乐数据提升音乐生成与分析的自动化水平,对音乐信息检索和计算音乐学领域产生了深远影响。
当前挑战
该数据集面临的挑战主要体现在两个方面。首先,在解决领域问题上,符号音乐数据的多样性和复杂性使得音乐生成与分析任务极具挑战性。例如,如何从多轨钢琴卷数据中提取有效的音乐特征,或如何将主旋律与和弦数据结合以实现更自然的音乐生成,都是亟待解决的问题。其次,在数据构建过程中,数据来源的异构性和格式不统一增加了数据清洗与整合的难度。此外,部分数据集的版权限制和可用性问题也对数据集的扩展与应用提出了挑战。这些因素共同构成了该数据集在研究与实际应用中的主要障碍。
常用场景
经典使用场景
在音乐信息检索和生成领域,Piano Roll, Lead Sheets, Midi数据集被广泛应用于音乐生成模型的训练与评估。通过解析钢琴卷帘、主旋律与和弦的符号化表示,研究者能够构建复杂的音乐生成算法,模拟不同风格的音乐创作。特别是在多轨音乐生成任务中,该数据集为模型提供了丰富的多声部音乐素材,使得生成结果更加贴近真实音乐作品。
衍生相关工作
基于Piano Roll, Lead Sheets, Midi数据集,许多经典研究工作得以展开。例如,Lakh Pianoroll Dataset(LPD)的衍生研究推动了多轨音乐生成技术的发展,而Theorytab数据集则为和弦生成和旋律分析提供了重要参考。此外,Wikifonia和Hymnal数据集的研究成果被广泛应用于音乐风格迁移和自动编曲任务中。这些工作不仅丰富了音乐生成领域的研究内容,也为后续研究提供了宝贵的实验数据和方法论支持。
数据集最近研究
最新研究方向
在音乐信息检索和生成领域,Piano Roll、Lead Sheets和MIDI数据集的研究方向主要集中在多模态音乐数据的融合与生成技术上。近年来,随着深度学习技术的快速发展,研究者们开始探索如何利用这些数据集进行音乐生成、风格迁移以及自动伴奏系统的开发。特别是在Piano Roll数据集中,基于LPD(Lakh Pianoroll Dataset)的预处理策略,研究者们能够更高效地提取和利用多轨钢琴卷信息,进而推动音乐生成模型的精度和多样性。此外,Lead Sheets数据集在流行音乐和爵士乐领域的应用也日益广泛,研究者们通过结合旋律和和弦信息,开发出能够自动生成复杂音乐结构的算法。MIDI数据集则在游戏音乐和古典音乐的自动生成与风格分析中发挥了重要作用,尤其是在多轨MIDI数据的处理上,研究者们通过引入新的神经网络架构,显著提升了音乐生成的自然度和表现力。这些研究不仅推动了音乐信息检索技术的发展,也为音乐创作和教学提供了新的工具和方法。
以上内容由遇见数据集搜集并总结生成



