dMelodies
收藏github2024-05-21 更新2024-05-31 收录
下载链接:
https://github.com/ashispati/dmelodies_dataset
下载链接
链接失效反馈官方服务:
资源简介:
dMelodies是一个用于研究解耦学习的音乐数据集,包含简单的2小节旋律,通过9个独立的潜在变量生成,每个数据点代表一个基于特定约束的独特旋律。
dMelodies is a music dataset designed for the study of decoupled learning, comprising simple 2-bar melodies generated through 9 independent latent variables. Each data point represents a unique melody based on specific constraints.
创建时间:
2020-05-18
原始信息汇总
dMelodies数据集概述
数据集名称
- 名称: dMelodies
- 全称: dMelodies: A Music Dataset for Disentanglement Learning
数据集目的
- 目的: 探索符号音乐中的解耦学习,为研究者提供一个标准化的数据集,以在不同领域展示其算法。
数据集描述
- 数据类型: 简单的2小节旋律
- 生成规则:
- 每首旋律对应一个独特的音阶(大调、小调、蓝调等)。
- 使用标准I-IV-V-I和弦进行演奏。
- 每小节演奏两个和弦(6个音符),每个音符为8分音符。
- 示例: 见数据集详情页中的示例图。
变量因素
- 因素: 共9个变量因素,包括基音、八度、模式/音阶、节奏等。
- 具体因素:
- 基音: 12个选项(C至B)
- 八度: 3个选项(C4至C6)
- 模式/音阶: 3个选项(大调、小调、蓝调)
- 节奏第一小节: 28个选项
- 节奏第二小节: 28个选项 6-9. 和弦的琶音方向: 每个和弦2个选项(上/下)
数据集规模
- 总数据点: 1,354,752
提供的数据格式
- 格式: numpy
.npz文件 - 包含内容:
score_array: 1354752 x 16, int32latent_array: 1354752 x 9, int32note2index_dict: 音符名称/符号到索引的映射index2note_dict: 索引到音符名称/符号的映射latent_dicts: 不同潜在因素值到相应整数索引的映射metadata: 附加信息(标题、作者、创建日期等)
数据集使用
- 环境配置: 使用conda环境,通过
environment.yml文件创建。 - 数据加载: 提供
DMelodiesDataset和DMelodiesTorchDataset类,用于数据集的读取和加载。
数据集创建
- 自定义数据集: 可通过运行
script_create_dataset.py创建自己的.npz文件,支持保存为.mid或.musicxml格式。
搜集汇总
数据集介绍

构建方式
在音乐信息检索领域,dMelodies数据集的构建旨在为解耦学习提供一个标准化的符号音乐数据集。该数据集通过生成简单的两小节旋律,利用九个独立的潜在变量因子进行设计。每个旋律基于特定的约束条件,如独特的音阶、标准的I-IV-V-I和弦模式以及每小节六个八分音符的节奏结构。这些因子包括音调、八度、音阶类型、节奏分布以及和弦的琶音方向等,共同构成了总数为1,354,752个数据点。
特点
dMelodies数据集的显著特点在于其多维度的潜在变量设计,这些变量涵盖了音乐元素的多个层面,如音高、节奏和和弦结构。此外,数据集的规模庞大,提供了丰富的音乐样本,有助于研究者在解耦学习中探索音乐数据的内在结构。数据集以numpy的.npz格式提供,包含乐谱数组、潜在变量数组、音符与索引的映射字典以及元数据,便于直接应用于机器学习和音乐信息检索的研究。
使用方法
使用dMelodies数据集时,首先需安装anaconda或miniconda,并创建一个基于environment.yml文件的新conda环境。激活dmelodies环境后,可通过DMelodiesDataset类或DMelodiesTorchDataset类加载数据集。前者适用于通用数据处理,后者则为PyTorch用户提供了便捷的数据加载接口。数据集的加载示例可在dmelodies_loading.ipynb文件中找到。此外,用户还可通过运行script_create_dataset.py脚本生成自定义版本的.npz文件,并选择保存为MIDI或MusicXML格式。
背景与挑战
背景概述
dMelodies数据集是由Ashis Pati、Siddharth Gururani和Alexander Lerch在2020年创建的,旨在探索符号音乐中的解耦学习。该数据集的诞生源于对当前解耦学习研究主要依赖于图像数据集的观察,研究人员希望通过创建一个标准化的音乐数据集,推动解耦学习算法在不同领域中的应用。dMelodies数据集包含1,354,752个由9个独立潜在因素生成的2小节旋律,每个旋律基于特定的音阶、和弦模式和节奏约束。这一数据集的发布为音乐信息检索领域提供了新的研究工具,有望促进解耦学习技术在音乐分析和生成中的应用。
当前挑战
dMelodies数据集在构建过程中面临多项挑战。首先,音乐数据的复杂性远超图像数据,如何有效地定义和分离潜在因素是一个重要问题。其次,生成大量高质量的符号音乐数据需要精确的算法和大量的计算资源。此外,数据集的多样性和代表性也是一个挑战,确保每个潜在因素的变化都能生成有意义的音乐片段,同时保持数据集的规模和质量。最后,如何有效地存储和处理如此大规模的数据,以及如何确保数据集的易用性和可扩展性,也是需要解决的问题。
常用场景
经典使用场景
在音乐信息检索领域,dMelodies数据集的经典使用场景主要集中在解耦学习(disentanglement learning)的研究中。该数据集通过提供由九个独立潜在因素生成的简单两小节旋律,为研究人员提供了一个标准化的测试平台。通过分析这些旋律的潜在因素,研究者可以验证和改进其解耦算法,特别是在音乐符号数据的多样性方面。
解决学术问题
dMelodies数据集解决了在音乐信息检索领域中,解耦学习算法缺乏标准化测试数据的问题。传统上,解耦学习研究多依赖于图像数据集,而dMelodies的出现填补了这一空白,使得研究者能够在音乐符号数据上进行有效的解耦实验。这不仅推动了音乐信息检索技术的发展,也为跨领域的解耦学习算法提供了新的验证平台。
衍生相关工作
dMelodies数据集的发布激发了一系列相关研究工作,特别是在音乐生成和音乐信息检索领域。例如,一些研究者利用该数据集开发了新的音乐生成模型,能够根据用户输入的潜在因素自动生成符合特定风格的旋律。此外,还有研究探讨了如何将解耦学习技术应用于音乐推荐系统,以提高推荐的准确性和个性化程度。
以上内容由遇见数据集搜集并总结生成



