five

omr_benchmark

收藏
Hugging Face2025-12-19 更新2025-12-20 收录
下载链接:
https://huggingface.co/datasets/musegroup/omr_benchmark
下载链接
链接失效反馈
官方服务:
资源简介:
Muse OMR Benchmark是一个小型、干净的基准数据集,用于光学音乐识别(OMR)任务,即从图像/PDF中识别音乐符号。数据集包含1077对数据,每对包括一个符号音乐乐谱(地面真实值)和一个经过数据增强的PDF渲染文件。所有基础作品均为公共领域。数据集旨在为OMR研究提供一个实用、可重复的公共基准。数据集中的PDF文件通过模拟现实世界扫描中的各种噪声(如墨水污渍、划痕、褶皱纸张、旋转/倾斜等)进行增强。数据集结构包括唯一的样本ID、增强的PDF文件和用于评估的MuseScore Studio格式的符号参考。
创建时间:
2025-12-18
原始信息汇总

Muse OMR Benchmark 数据集概述

数据集基本信息

  • 数据集名称:Muse OMR Benchmark
  • 语言:英语
  • 许可证:CC0-1.0
  • 任务类别:图像特征提取
  • 标签:光学音乐识别、乐谱、音乐记谱法、公共领域、基准测试
  • 数据规模:1K<n<10K
  • 数据对数量:1077对

数据集目的

旨在为光学音乐识别(OMR)领域提供一个实用、可复现的公共基准测试数据集,以解决该领域常使用私有或不一致数据集进行评估的问题。

数据集内容

  • 数据构成:包含符号音乐乐谱(“真实标注”)与对应的PDF渲染图像对。
  • 乐谱来源:所有底层作品均属于公共领域。
  • PDF生成:从自有公共领域乐谱目录生成PDF,并应用数据增强以模拟真实世界扫描效果。
  • 数据增强类型:包括墨水污渍/污点、划痕/磨损、褶皱或纹理纸张、旋转/倾斜及其他视觉噪声。

数据集结构

数据集以数据对形式分发,典型字段包括:

  • id:唯一样本标识符
  • pdf_image:增强后的PDF文件
  • score:用于评估的MuseScore Studio文件格式的符号参考乐谱

相关资源

  • 官方评估代码仓库:https://github.com/musescore/omr_benchmark

引用信息

若在论文或公共基准测试中使用此数据集,请引用: bibtex @dataset{pd_omr_benchmark, title = {Muse OMR Benchmark}, author = {Vasily Pereverzev and Kristina Abdullina}, year = {2025}, }

搜集汇总
数据集介绍
main_image_url
构建方式
在光学音乐识别领域,构建高质量基准数据集对于推动算法发展至关重要。Muse OMR Benchmark 数据集基于公共领域乐谱资源,通过系统化流程生成1077对样本。每对样本包含一个符号化乐谱作为真实标注,以及一个经过数据增强处理的PDF渲染图像。增强过程模拟了真实扫描文档中常见的退化现象,如墨迹污渍、纸张褶皱、旋转偏移等,从而提升了数据集的现实代表性。
特点
该数据集以其严谨的构建理念和实用性著称。所有乐谱素材均源自公共领域,确保了法律层面的广泛可用性。其核心特点在于通过可控的数据增强技术,生成了模拟现实世界扫描质量的图像,涵盖了多种噪声与形变类型,为评估OMR系统的鲁棒性提供了丰富场景。数据集规模适中,结构清晰,每项样本均配有唯一标识符、增强PDF图像及MuseScore格式的符号化参考文件,便于进行标准化评测与对比分析。
使用方法
研究人员可利用该数据集对光学音乐识别模型进行训练与基准测试。典型使用流程包括加载数据对,将PDF图像输入识别模型,并将输出结果与提供的符号化乐谱真实标注进行比较。官方代码仓库提供了标准化的评估脚本,确保了结果的可复现性。该数据集适用于评估模型在应对各种图像退化条件下的性能,是推动OMR技术向更实用、更鲁棒方向发展的关键工具。
背景与挑战
背景概述
光学音乐识别(OMR)作为音乐信息检索领域的关键分支,致力于从图像或PDF文档中自动提取音乐符号信息,以实现乐谱的数字化与结构化分析。Muse OMR Benchmark数据集由Vasily Pereverzev与Kristina Abdullina于2025年创建,旨在为学术界提供一个公开、可复现的基准测试平台。该数据集基于公共领域乐谱构建,包含1077对符号乐谱与增强渲染PDF,核心研究问题聚焦于提升OMR系统在复杂现实场景中的鲁棒性与准确性,对推动音乐技术标准化评估具有重要影响力。
当前挑战
在光学音乐识别领域,主要挑战在于处理乐谱图像中的多样化噪声干扰,如墨迹污损、纸张褶皱、旋转畸变等复杂退化现象,这些因素严重影响了符号分割与识别的精度。数据集构建过程中,研究人员需模拟真实扫描环境,通过数据增强技术生成逼真的退化样本,同时确保增强过程既保持乐谱语义一致性,又能覆盖广泛的实际应用场景。此外,平衡数据规模与标注质量,以及建立公平的评估框架,亦是该基准面临的关键难题。
常用场景
经典使用场景
在光学音乐识别领域,OMR Benchmark数据集常被用于评估和比较不同算法的性能。该数据集通过提供标准化的符号音乐参考与经过数据增强的PDF渲染图像配对,为研究者提供了一个可重复的测试平台。其经典使用场景包括训练和验证深度学习模型,如卷积神经网络,以识别扫描乐谱中的音符、休止符及其他音乐符号,从而推动自动音乐转录技术的发展。
实际应用
在实际应用中,OMR Benchmark数据集支持音乐数字化存档、教育工具开发以及音乐分析软件的优化。例如,图书馆和档案馆可利用基于该数据集训练的模型,将历史乐谱扫描件自动转换为可编辑的符号格式,便于保存和检索。此外,音乐教育平台能集成OMR技术,实现乐谱的即时识别与互动学习,提升用户体验和教学效率。
衍生相关工作
围绕OMR Benchmark数据集,已衍生出多项经典研究工作,包括基于深度学习的端到端识别系统和增强鲁棒性的预处理方法。例如,一些研究利用该数据集训练Transformer架构模型,以处理复杂乐谱布局;另一些工作则专注于噪声去除和图像校正技术,提高在模拟真实扫描条件下的识别准确率。这些进展共同推动了光学音乐识别领域的算法多样性与性能提升。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作