omr_benchmark

Hugging Face2025-12-19 更新2025-12-20 收录

下载链接：

https://huggingface.co/datasets/musegroup/omr_benchmark

下载链接

链接失效反馈

官方服务：

资源简介：

Muse OMR Benchmark是一个小型、干净的基准数据集，用于光学音乐识别（OMR）任务，即从图像/PDF中识别音乐符号。数据集包含1077对数据，每对包括一个符号音乐乐谱（地面真实值）和一个经过数据增强的PDF渲染文件。所有基础作品均为公共领域。数据集旨在为OMR研究提供一个实用、可重复的公共基准。数据集中的PDF文件通过模拟现实世界扫描中的各种噪声（如墨水污渍、划痕、褶皱纸张、旋转/倾斜等）进行增强。数据集结构包括唯一的样本ID、增强的PDF文件和用于评估的MuseScore Studio格式的符号参考。

创建时间：

2025-12-18

原始信息汇总

Muse OMR Benchmark 数据集概述

数据集基本信息

数据集名称：Muse OMR Benchmark
语言：英语
许可证：CC0-1.0
任务类别：图像特征提取
标签：光学音乐识别、乐谱、音乐记谱法、公共领域、基准测试
数据规模：1K<n<10K
数据对数量：1077对

数据集目的

旨在为光学音乐识别（OMR）领域提供一个实用、可复现的公共基准测试数据集，以解决该领域常使用私有或不一致数据集进行评估的问题。

数据集内容

数据构成：包含符号音乐乐谱（“真实标注”）与对应的PDF渲染图像对。
乐谱来源：所有底层作品均属于公共领域。
PDF生成：从自有公共领域乐谱目录生成PDF，并应用数据增强以模拟真实世界扫描效果。
数据增强类型：包括墨水污渍/污点、划痕/磨损、褶皱或纹理纸张、旋转/倾斜及其他视觉噪声。

数据集结构

数据集以数据对形式分发，典型字段包括：

id：唯一样本标识符
pdf_image：增强后的PDF文件
score：用于评估的MuseScore Studio文件格式的符号参考乐谱

引用信息

若在论文或公共基准测试中使用此数据集，请引用： bibtex @dataset{pd_omr_benchmark, title = {Muse OMR Benchmark}, author = {Vasily Pereverzev and Kristina Abdullina}, year = {2025}, }

搜集汇总

数据集介绍

构建方式

在光学音乐识别领域，构建高质量基准数据集对于推动算法发展至关重要。Muse OMR Benchmark 数据集基于公共领域乐谱资源，通过系统化流程生成1077对样本。每对样本包含一个符号化乐谱作为真实标注，以及一个经过数据增强处理的PDF渲染图像。增强过程模拟了真实扫描文档中常见的退化现象，如墨迹污渍、纸张褶皱、旋转偏移等，从而提升了数据集的现实代表性。

特点

该数据集以其严谨的构建理念和实用性著称。所有乐谱素材均源自公共领域，确保了法律层面的广泛可用性。其核心特点在于通过可控的数据增强技术，生成了模拟现实世界扫描质量的图像，涵盖了多种噪声与形变类型，为评估OMR系统的鲁棒性提供了丰富场景。数据集规模适中，结构清晰，每项样本均配有唯一标识符、增强PDF图像及MuseScore格式的符号化参考文件，便于进行标准化评测与对比分析。

使用方法

研究人员可利用该数据集对光学音乐识别模型进行训练与基准测试。典型使用流程包括加载数据对，将PDF图像输入识别模型，并将输出结果与提供的符号化乐谱真实标注进行比较。官方代码仓库提供了标准化的评估脚本，确保了结果的可复现性。该数据集适用于评估模型在应对各种图像退化条件下的性能，是推动OMR技术向更实用、更鲁棒方向发展的关键工具。

背景与挑战

背景概述

光学音乐识别（OMR）作为音乐信息检索领域的关键分支，致力于从图像或PDF文档中自动提取音乐符号信息，以实现乐谱的数字化与结构化分析。Muse OMR Benchmark数据集由Vasily Pereverzev与Kristina Abdullina于2025年创建，旨在为学术界提供一个公开、可复现的基准测试平台。该数据集基于公共领域乐谱构建，包含1077对符号乐谱与增强渲染PDF，核心研究问题聚焦于提升OMR系统在复杂现实场景中的鲁棒性与准确性，对推动音乐技术标准化评估具有重要影响力。

当前挑战

在光学音乐识别领域，主要挑战在于处理乐谱图像中的多样化噪声干扰，如墨迹污损、纸张褶皱、旋转畸变等复杂退化现象，这些因素严重影响了符号分割与识别的精度。数据集构建过程中，研究人员需模拟真实扫描环境，通过数据增强技术生成逼真的退化样本，同时确保增强过程既保持乐谱语义一致性，又能覆盖广泛的实际应用场景。此外，平衡数据规模与标注质量，以及建立公平的评估框架，亦是该基准面临的关键难题。

常用场景

经典使用场景

在光学音乐识别领域，OMR Benchmark数据集常被用于评估和比较不同算法的性能。该数据集通过提供标准化的符号音乐参考与经过数据增强的PDF渲染图像配对，为研究者提供了一个可重复的测试平台。其经典使用场景包括训练和验证深度学习模型，如卷积神经网络，以识别扫描乐谱中的音符、休止符及其他音乐符号，从而推动自动音乐转录技术的发展。

实际应用

在实际应用中，OMR Benchmark数据集支持音乐数字化存档、教育工具开发以及音乐分析软件的优化。例如，图书馆和档案馆可利用基于该数据集训练的模型，将历史乐谱扫描件自动转换为可编辑的符号格式，便于保存和检索。此外，音乐教育平台能集成OMR技术，实现乐谱的即时识别与互动学习，提升用户体验和教学效率。

衍生相关工作

围绕OMR Benchmark数据集，已衍生出多项经典研究工作，包括基于深度学习的端到端识别系统和增强鲁棒性的预处理方法。例如，一些研究利用该数据集训练Transformer架构模型，以处理复杂乐谱布局；另一些工作则专注于噪声去除和图像校正技术，提高在模拟真实扫描条件下的识别准确率。这些进展共同推动了光学音乐识别领域的算法多样性与性能提升。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集