zzsi/synthetic-scores
收藏Hugging Face2026-03-28 更新2026-03-29 收录
下载链接:
https://hf-mirror.com/datasets/zzsi/synthetic-scores
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
- config_name: level1
features:
- name: image
dtype: image
- name: musicxml
dtype: string
- name: score_id
dtype: string
- name: level
dtype: int64
splits:
- name: train
num_bytes: 24384401
num_examples: 800
- name: dev
num_bytes: 3052446
num_examples: 100
- name: test
num_bytes: 3048241
num_examples: 100
download_size: 16943519
dataset_size: 30485088
- config_name: level2
features:
- name: image
dtype: image
- name: musicxml
dtype: string
- name: score_id
dtype: string
- name: level
dtype: int64
splits:
- name: train
num_bytes: 30211813
num_examples: 800
- name: dev
num_bytes: 3752937
num_examples: 100
- name: test
num_bytes: 3786705
num_examples: 100
download_size: 24466274
dataset_size: 37751455
- config_name: level3
features:
- name: image
dtype: image
- name: musicxml
dtype: string
- name: score_id
dtype: string
- name: level
dtype: int64
splits:
- name: train
num_bytes: 31837370
num_examples: 800
- name: dev
num_bytes: 3947589
num_examples: 100
- name: test
num_bytes: 3869985
num_examples: 100
download_size: 26188867
dataset_size: 39654944
- config_name: level4
features:
- name: image
dtype: image
- name: musicxml
dtype: string
- name: score_id
dtype: string
- name: level
dtype: int64
splits:
- name: train
num_bytes: 29443536
num_examples: 800
- name: dev
num_bytes: 3697073
num_examples: 100
- name: test
num_bytes: 3623690
num_examples: 100
download_size: 24030882
dataset_size: 36764299
- config_name: level5
features:
- name: image
dtype: image
- name: musicxml
dtype: string
- name: score_id
dtype: string
- name: level
dtype: int64
splits:
- name: train
num_bytes: 61598047
num_examples: 800
- name: dev
num_bytes: 7824177
num_examples: 100
- name: test
num_bytes: 7814870
num_examples: 100
download_size: 51551365
dataset_size: 77237094
- config_name: level6
features:
- name: image
dtype: image
- name: musicxml
dtype: string
- name: score_id
dtype: string
- name: level
dtype: int64
splits:
- name: train
num_bytes: 79212046
num_examples: 800
- name: dev
num_bytes: 9930843
num_examples: 100
- name: test
num_bytes: 10119626
num_examples: 100
download_size: 55985877
dataset_size: 99262515
- config_name: level7
features:
- name: image
dtype: image
- name: musicxml
dtype: string
- name: score_id
dtype: string
- name: level
dtype: int64
splits:
- name: train
num_bytes: 190032612
num_examples: 800
- name: dev
num_bytes: 23856141
num_examples: 100
- name: test
num_bytes: 23881230
num_examples: 100
download_size: 149300126
dataset_size: 237769983
configs:
- config_name: level1
data_files:
- split: train
path: level1/train-*
- split: dev
path: level1/dev-*
- split: test
path: level1/test-*
- config_name: level2
data_files:
- split: train
path: level2/train-*
- split: dev
path: level2/dev-*
- split: test
path: level2/test-*
- config_name: level3
data_files:
- split: train
path: level3/train-*
- split: dev
path: level3/dev-*
- split: test
path: level3/test-*
- config_name: level4
data_files:
- split: train
path: level4/train-*
- split: dev
path: level4/dev-*
- split: test
path: level4/test-*
- config_name: level5
data_files:
- split: train
path: level5/train-*
- split: dev
path: level5/dev-*
- split: test
path: level5/test-*
- config_name: level6
data_files:
- split: train
path: level6/train-*
- split: dev
path: level6/dev-*
- split: test
path: level6/test-*
- config_name: level7
data_files:
- split: train
path: level7/train-*
- split: dev
path: level7/dev-*
- split: test
path: level7/test-*
---
提供机构:
zzsi
搜集汇总
数据集介绍

构建方式
在音乐信息检索领域,合成乐谱数据集为算法开发提供了关键资源。该数据集通过程序化生成方式构建,涵盖了七个不同复杂度的层级,每个层级包含图像格式的乐谱及其对应的MusicXML结构化数据。每个层级均划分为训练集、验证集和测试集,确保数据在机器学习任务中的有效分割与利用。这种分层设计使得数据集能够适应从基础到高级的音乐符号识别研究需求,为模型训练提供了渐进式的学习材料。
特点
该数据集的核心特征在于其层级化的结构设计,每个层级对应不同的音乐符号复杂度,从简单的音符排列到复杂的多声部乐谱。数据集中每个样本均包含乐谱图像和标准化的MusicXML文件,实现了视觉信息与结构化数据的对齐。这种双重表示形式为跨模态学习任务提供了理想基础,支持光学音乐识别、乐谱生成及音乐分析等多种研究方向。数据规模的逐级扩展也反映了音乐符号系统的内在复杂性,为算法鲁棒性评估创造了条件。
使用方法
研究人员可通过HuggingFace数据集库直接加载该数据集,利用其预定义的分割配置进行模型训练与评估。每个层级的独立配置允许针对特定复杂度开展专项研究,也可通过跨层级训练探索模型的泛化能力。典型应用场景包括训练卷积神经网络进行乐谱图像识别,或结合序列模型处理MusicXML数据以生成音乐符号。验证集和测试集的规范划分确保了实验结果的可靠性与可复现性,为音乐信息检索领域的算法比较提供了标准化基准。
背景与挑战
背景概述
在光学乐谱识别领域,高质量标注数据的稀缺长期制约着深度学习模型的性能提升。synthetic-scores数据集应运而生,旨在通过合成方法生成大规模、多层次的乐谱图像与MusicXML标注对,为OMR技术提供丰富的训练资源。该数据集由研究团队精心构建,依据乐谱复杂度划分为七个等级,每个等级包含图像、结构化符号及难度标签,系统性地覆盖了从基础到高级的乐谱识别任务。其层次化设计不仅促进了模型在渐进难度下的稳健学习,也为评估算法在不同复杂场景下的泛化能力建立了标准化基准,对推动音乐信息检索与数字化存档研究具有显著价值。
当前挑战
synthetic-scores数据集致力于解决光学乐谱识别中数据匮乏与标注成本高昂的核心难题,其挑战主要体现在领域问题与构建过程两方面。在领域层面,乐谱识别需应对图像变形、符号重叠及版面多样性等复杂视觉干扰,同时要求模型精确解析音乐语义结构,这对算法的鲁棒性与音乐理解能力提出了极高要求。构建过程中,合成数据需在视觉逼真度与音乐逻辑合理性之间取得平衡,确保生成的乐谱图像既贴近真实扫描效果,又符合音乐理论规范,且层次划分需科学反映识别难度梯度,避免引入人为偏差,这些因素共同构成了数据集创建的技术瓶颈。
常用场景
经典使用场景
在光学音乐识别领域,synthetic-scores数据集通过提供图像与MusicXML格式乐谱的配对,成为训练和评估自动乐谱识别模型的核心资源。该数据集涵盖了从简单到复杂的七个难度级别,使得研究者能够系统地测试模型在不同乐理复杂度下的性能。经典使用场景包括构建端到端的神经网络,将乐谱图像转换为结构化的数字符号,从而推动音乐信息检索技术的进步。
解决学术问题
该数据集有效解决了乐谱识别中数据稀缺与标注成本高昂的学术难题。通过合成方法生成大规模、多层次的乐谱数据,它为模型训练提供了高质量且多样化的样本,克服了传统依赖手工标注的局限性。其意义在于促进了深度学习在音乐符号识别中的应用,为跨模态音乐理解研究奠定了数据基础,显著提升了识别准确性与泛化能力。
衍生相关工作
围绕synthetic-scores数据集,衍生了一系列经典研究工作,包括基于卷积神经网络与循环神经网络的混合模型,用于乐谱图像到符号的序列转换。这些工作进一步拓展了多模态音乐分析领域,例如结合光学字符识别与音乐语义理解,开发出更鲁棒的乐谱识别系统。相关成果已应用于开源音乐处理工具库,持续推动着音乐科技的发展。
以上内容由遇见数据集搜集并总结生成



