five

roszcz/maestro-base-v2

收藏
Hugging Face2023-11-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/roszcz/maestro-base-v2
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: notes struct: - name: end sequence: float64 - name: pitch sequence: int64 - name: start sequence: float64 - name: velocity sequence: int64 - name: control_changes struct: - name: number sequence: int64 - name: time sequence: float64 - name: value sequence: int64 - name: source dtype: string splits: - name: validation num_bytes: 53035261.55642633 num_examples: 137 - name: test num_bytes: 68520009.45611285 num_examples: 177 - name: train num_bytes: 372408186.9874608 num_examples: 962 download_size: 141530448 dataset_size: 493963458.0 --- # Dataset Card for "maestro-base-v2" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)

--- 数据集信息: 特征: - 名称:音符(notes) 结构体: - 名称:结束时间,类型为64位浮点型(float64)序列 - 名称:音高,类型为64位整型(int64)序列 - 名称:开始时间,类型为64位浮点型(float64)序列 - 名称:音符力度(velocity),类型为64位整型(int64)序列 - 名称:控制器变化(control_changes) 结构体: - 名称:控制器编号,类型为64位整型(int64)序列 - 名称:事件时间,类型为64位浮点型(float64)序列 - 名称:参数值,类型为64位整型(int64)序列 - 名称:数据来源(source),数据类型为字符串(string) 数据集划分: - 名称:验证集(validation),字节数:53035261.55642633,样本数:137 - 名称:测试集(test),字节数:68520009.45611285,样本数:177 - 名称:训练集(train),字节数:372408186.9874608,样本数:962 下载大小:141530448 字节 数据集总大小:493963458.0 字节 --- # "maestro-base-v2"数据集卡片 [需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
roszcz
原始信息汇总

数据集信息

特征

  • notes
    • end: 序列类型,数据类型为 float64
    • pitch: 序列类型,数据类型为 int64
    • start: 序列类型,数据类型为 float64
    • velocity: 序列类型,数据类型为 int64
  • control_changes
    • number: 序列类型,数据类型为 int64
    • time: 序列类型,数据类型为 float64
    • value: 序列类型,数据类型为 int64
  • source: 数据类型为 string

数据分割

  • validation
    • 字节数: 53035261.55642633
    • 样本数: 137
  • test
    • 字节数: 68520009.45611285
    • 样本数: 177
  • train
    • 字节数: 372408186.9874608
    • 样本数: 962

数据集大小

  • 下载大小: 141530448 字节
  • 数据集总大小: 493963458.0 字节
搜集汇总
数据集介绍
main_image_url
构建方式
在音乐信息检索领域,高质量的数据集对于算法训练至关重要。该数据集基于MAESTRO项目构建,通过采集真实钢琴演奏的MIDI数据与音频对齐,形成结构化音乐序列。其构建过程涉及对原始演奏录音的精确时间标注,将音符起始、音高、力度等参数转化为序列化特征,并整合控制变化信息以保留演奏的细微表达。数据经过清洗与标准化处理,划分为训练、验证与测试子集,确保了数据的可靠性与一致性,为音乐生成与分析任务提供了坚实基础。
特点
该数据集在音乐计算领域展现出显著特点,其核心在于提供了丰富的结构化音乐表示。特征维度涵盖音符序列的时序、音高与力度参数,同时包含控制变化信息,能够捕捉演奏中的动态细节。数据规模适中,包含超过千条样本,划分为训练、验证与测试集,支持模型的有效评估。此外,数据来源标注清晰,确保了可追溯性,适用于需要高精度音乐符号分析的研究,如自动作曲、演奏风格建模等任务。
使用方法
在音乐人工智能应用中,该数据集的使用方法聚焦于序列化音乐数据的处理。用户可通过加载预处理的音符与控制变化特征,直接应用于机器学习模型的输入,例如使用循环神经网络或Transformer架构进行音乐生成。数据已分割为训练、验证与测试集,便于执行模型训练与性能评估。建议结合音频对齐信息进行多模态分析,或利用MIDI工具进行可视化与后处理,以拓展在音乐教育、创作辅助等场景的应用潜力。
背景与挑战
背景概述
在音乐信息检索领域,符号音乐数据的标准化与大规模数据集构建是推动算法发展的基石。MAESTRO数据集由国际音乐数据研究组织于2018年创建,旨在提供高质量、对齐的钢琴演奏音频与MIDI数据,其核心研究问题聚焦于跨模态音乐表征学习与自动转录技术。该数据集通过精确的时间对齐标注,为音乐生成、演奏风格分析及自动伴奏系统提供了关键资源,显著促进了计算音乐学与人工智能的交叉研究进展。
当前挑战
MAESTRO数据集所针对的音乐自动转录任务面临多重挑战:钢琴音乐中复调声部的交织与和声结构的复杂性,使得音符起始检测与音高识别极易受到干扰;演奏中踏板使用与力度变化进一步增加了时序对齐的难度。在数据构建过程中,挑战主要源于原始演奏录音与MIDI信号的高精度同步,需克服音频噪声、演奏偏差及设备延迟带来的对齐误差,同时确保跨曲目标注的一致性,这对数据清洗与标注流程提出了极高要求。
常用场景
经典使用场景
在音乐信息检索领域,maestro-base-v2数据集以其精确的钢琴演奏时序与音符标注,为自动音乐转录任务提供了关键支撑。该数据集通过记录音符的起始、结束时间、音高及力度等结构化信息,使得研究者能够训练模型从音频信号中准确识别并生成乐谱表示,推动了音乐符号化分析的深度发展。
解决学术问题
该数据集有效解决了音乐计算中乐谱自动生成的长期挑战,通过提供高质量的标注数据,促进了基于深度学习的端到端转录模型的研究。它不仅降低了人工标注的成本,还提升了转录的准确性与鲁棒性,为音乐理论分析、作曲辅助等学术方向奠定了数据基础,具有重要的方法论意义。
衍生相关工作
基于maestro-base-v2数据集,衍生出多项经典研究工作,如采用Transformer架构的自动音乐转录模型,以及结合多模态学习的音乐生成系统。这些工作不仅优化了转录性能,还拓展了数据在音乐风格迁移、情感分析等交叉领域的应用,形成了活跃的研究生态。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作