Symbolic Musical Datasets
收藏github2024-05-12 更新2024-05-31 收录
下载链接:
https://github.com/wayne391/Symbolic-Musical-Datasets
下载链接
链接失效反馈官方服务:
资源简介:
该仓库收集了网络上可访问的象征性音乐数据集,包括钢琴卷、领唱表、MIDI等多种格式,每个数据集都有详细的来源和格式说明。
This repository aggregates a collection of symbolic music datasets accessible on the internet, encompassing various formats such as piano rolls, lead sheets, and MIDI files. Each dataset is accompanied by detailed information regarding its origin and format specifications.
创建时间:
2017-11-07
原始信息汇总
数据集概述
Piano Roll
-
5 track piano-roll dataset
- 来源:基于LPD进行新的预处理。
- 描述:包含5条轨道的钢琴卷数据集。
-
lead sheet dataset
- 来源:Theorytab。
- 描述:此数据集具有与其他lead sheet数据集结合的潜力。
Lead Sheets
- Crawled Datasets
-
Theorytab
- 类型:流行
- 格式:XML
- 包含:和弦、旋律
- 歌曲数量:10148
- 下载链接:Google Drive
-
Wikifonia
- 类型:流行
- 格式:XML
- 包含:和弦、旋律
- 歌曲数量:6675
- 下载链接:Google Drive
-
Hymnal
- 类型:赞美诗
- 格式:MIDI
- 包含:旋律
- 歌曲数量:3358
- 下载链接:Google Drive
-
MIDI
- Crawled Datasets
-
VGMdb
- 类型:游戏音乐
- 格式:MIDI
- 多轨道:是
- 歌曲数量:28419
- 下载链接:Google Drive
-
Doug McKenzie Jazz
- 类型:爵士
- 格式:MIDI
- 多轨道:是
- 歌曲数量:297
- 下载链接:Google Drive
-
Piano-e-Competition
- 类型:古典
- 格式:MIDI
- 歌曲数量:1573
- 下载链接:Google Drive
-
MISC
- Unchecked Resources
- 描述:一系列未经验证的音乐资源链接。
搜集汇总
数据集介绍

构建方式
在构建Symbolic Musical Datasets数据集时,研究者们广泛收集了网络上的符号音乐数据,并进行了系统的整理与预处理。具体而言,数据集包括了从不同来源获取的钢琴卷轴(Piano-roll)、主旋律与和弦(Lead Sheet)、MIDI格式以及其他多种符号音乐数据。例如,钢琴卷轴数据集源自LPD数据集,并采用了新的预处理策略;主旋律与和弦数据集则主要来源于Theorytab,并与其他数据集进行了整合。此外,MIDI数据集涵盖了从游戏音乐到爵士乐等多种风格,且部分数据集支持多轨道的MIDI格式。
特点
Symbolic Musical Datasets数据集的显著特点在于其多样性和广泛性。该数据集不仅涵盖了多种音乐风格,如流行、爵士、古典等,还支持多种符号音乐格式,包括钢琴卷轴、主旋律与和弦、MIDI等。此外,数据集中的部分数据支持多轨道格式,为音乐分析和生成提供了丰富的资源。数据集的多样性使其适用于多种音乐信息处理任务,如音乐生成、和弦识别和旋律分析等。
使用方法
Symbolic Musical Datasets数据集的使用方法灵活多样,适用于多种音乐信息处理任务。用户可以根据需求选择不同的数据格式,如钢琴卷轴、主旋律与和弦或MIDI格式,并利用数据集中的样本进行模型训练或测试。此外,数据集还提供了相关的工具代码,用于数据的爬取和预处理,方便用户进行定制化的数据处理。对于特定的研究需求,用户还可以结合其他数据集进行扩展研究,以进一步提升模型的性能和泛化能力。
背景与挑战
背景概述
符号音乐数据集(Symbolic Musical Datasets)是由一系列研究人员和机构共同创建的,旨在收集和整理网络上可访问的符号音乐数据。这些数据集涵盖了多种音乐形式,如钢琴卷(Piano-roll)、主旋律与和弦(Lead Sheet)、MIDI格式以及其他多种音乐符号表示。该数据集的创建时间可追溯至多个子数据集的原始发布时间,主要研究人员和机构包括LPD、Theorytab、Wikifonia等。核心研究问题围绕如何有效地表示和分析符号音乐,以推动音乐信息检索、音乐生成和音乐分析等领域的发展。这些数据集对音乐领域的研究具有重要影响力,为研究人员提供了丰富的资源,促进了符号音乐处理技术的进步。
当前挑战
符号音乐数据集在构建和应用过程中面临多项挑战。首先,符号音乐数据的多样性和复杂性使得数据的标准化和统一处理变得困难。不同来源的数据格式各异,如XML、MIDI等,需要进行复杂的预处理和转换。其次,数据的质量和一致性也是一个重要问题,部分数据可能存在缺失或错误,影响后续分析的准确性。此外,符号音乐数据的版权问题也较为复杂,如何在合法合规的前提下使用和共享这些数据是一个亟待解决的挑战。最后,符号音乐数据的规模和多样性对计算资源和算法提出了更高的要求,如何在有限的资源下高效处理和分析这些数据也是一个重要的研究方向。
常用场景
经典使用场景
符号音乐数据集在音乐信息检索、音乐生成和音乐分析等领域具有广泛的应用。例如,钢琴卷轴数据集常用于训练自动音乐生成模型,通过分析音符的时间和强度信息,模型能够生成具有特定风格和结构的乐曲。此外,和弦与旋律数据集则常用于和弦识别和旋律提取任务,帮助研究人员理解音乐中的和声结构和旋律走向。
解决学术问题
符号音乐数据集解决了音乐信息处理中的多个关键问题,如音乐自动生成、和弦识别、旋律提取和音乐风格迁移等。这些数据集为研究人员提供了丰富的音乐符号数据,使得机器学习模型能够更好地理解和生成音乐,推动了音乐信息检索和音乐生成技术的发展。
衍生相关工作
符号音乐数据集的广泛应用催生了许多相关研究工作。例如,基于钢琴卷轴数据集的研究推动了自动音乐生成技术的发展,而和弦与旋律数据集则促进了和弦识别和旋律提取算法的进步。此外,这些数据集还为音乐风格迁移和音乐情感分析等新兴研究领域提供了重要的数据支持。
以上内容由遇见数据集搜集并总结生成



