five

DoReMi

收藏
arXiv2021-07-16 更新2024-06-21 收录
下载链接:
https://github.com/steinbergmedia/DoReMi/releases
下载链接
链接失效反馈
官方服务:
资源简介:
DoReMi数据集是由伦敦玛丽女王大学数字音乐中心创建,专注于光学音乐识别(OMR)领域。该数据集包含超过6400张打印的乐谱图像,并附有丰富的元数据,支持OMR研究的多个阶段。数据集内容包括MIDI、MEI、MusicXML和PNG文件等,每种文件格式支持OMR的不同阶段。DoReMi数据集不仅支持对象检测,还提供音乐语义信息,有助于开发端到端的深度学习系统。该数据集的应用领域广泛,旨在解决手动数字化乐谱的效率问题,以及提升音乐档案和图书馆中未数字化乐谱的可访问性。

The DoReMi Dataset was developed by the Digital Music Center at Queen Mary University of London, focusing on the field of Optical Music Recognition (OMR). This dataset includes over 6,400 printed sheet music images, paired with rich metadata that supports multiple stages of OMR research. The dataset contains various file formats such as MIDI, MEI, MusicXML and PNG, each of which caters to different stages of OMR workflows. The DoReMi Dataset not only supports object detection but also provides musical semantic information, facilitating the development of end-to-end deep learning systems. With broad application scenarios, this dataset aims to address the efficiency issues of manual sheet music digitization and improve the accessibility of undigitized sheet music in music archives and libraries.
提供机构:
伦敦玛丽女王大学数字音乐中心
创建时间:
2021-07-16
搜集汇总
数据集介绍
main_image_url
构建方式
DoReMi数据集的构建基于音乐符号软件,涵盖了超过6400张印刷乐谱图像及其伴随的元数据,这些数据对于OMR研究非常有用。该数据集包括OMR元数据、MIDI、MEI、MusicXML和PNG文件,每个文件都在OMR的不同阶段提供了帮助。DoReMi数据集的创建是为了解决现有数据集无法满足更广泛研究的问题,通过提供更多元数据来改变这一趋势。DoReMi数据集允许与DeepScores和MUSCIMA++两个现有数据集进行协调,从而支持更广泛的研究。
特点
DoReMi数据集的特点是其丰富的数据类型和格式,包括XML(带有位置)、MusicXML、PNG、MEI和MIDI文件,这些文件提供了互补的信息。该数据集包括近百万个注释对象,分为94个不同的类别,其中许多对象包含语义信息,例如音符的音高、持续时间、拍子以及它们与乐谱中其他元素的关系。此外,DoReMi数据集还提供了各种类型的音乐表示,包括MusicXML、MIDI、MEI和PNG乐谱图像,以及OMR元数据。
使用方法
使用DoReMi数据集的方法包括将数据集与DeepScores和MUSCIMA++数据集协调,以进行更广泛的研究。此外,该数据集可用于训练端到端的OMR系统,这些系统可以识别非单声部乐谱。为了使用DoReMi数据集,研究人员可以下载数据集文件,并使用XML文件中的元数据来定位和识别乐谱中的对象。此外,研究人员可以使用MIDI、MEI、MusicXML和PNG文件来重建和编码音乐信息。最后,研究人员可以使用DoReMi数据集来开发自定义OMR模型,以进一步提高OMR研究的水平。
背景与挑战
背景概述
光学音乐识别(Optical Music Recognition, OMR)领域长期以来面临着诸多挑战,其中最为突出的是音乐符号的复杂性和寻找合适的音乐数据表示。DoReMi数据集由伦敦玛丽女王大学数字音乐中心的Elona Shatri和György Fazekas创建,旨在解决这些问题。DoReMi数据集的创建背景源于当前OMR研究数据的局限性,这些数据往往无法满足更广泛的研究需求。DoReMi数据集包括超过6400张印刷乐谱图片及其相关元数据,这些数据对于OMR研究非常有用。该数据集提供了OMR元数据、MIDI、MEI、MusicXML和PNG文件,每个文件都支持OMR的不同阶段。DoReMi数据集的创建不仅为OMR研究提供了一个新的数据来源,而且通过与DeepScores和MUSCIMA++数据集的兼容性,为创建一个通用的OMR数据集提供了可能性,从而推动了OMR研究的发展。
当前挑战
DoReMi数据集面临的挑战主要来自于OMR领域的问题以及数据集构建过程中的困难。OMR领域的问题包括音乐符号的复杂性、音乐表示的多样性以及音乐数据的丰富性。在数据集构建过程中,研究人员需要考虑如何处理不同类型和格式的音乐数据,如何标注音乐数据中的对象和关系,以及如何保证数据集的质量和可用性。此外,DoReMi数据集还需要与其他OMR数据集进行整合和兼容,以便为OMR研究提供更全面的数据支持。
常用场景
经典使用场景
在光学音乐识别(OMR)领域,DoReMi数据集提供了一个全面的视角,以应对音乐符号的复杂性以及寻找适当数据表示的挑战。该数据集通过提供丰富的元数据和多种音乐符号表示形式,如MIDI、MEI、MusicXML和PNG文件,支持OMR研究的各个阶段,包括对象检测、重建和编码。DoReMi数据集的创建旨在促进OMR研究的标准化和通用化,使其成为OMR研究的宝贵资源。
衍生相关工作
DoReMi数据集的出现,为OMR研究带来了新的研究方向和机遇,衍生出了一系列相关工作。例如,研究人员可以基于DoReMi数据集开发更先进的OMR模型,以提高OMR系统的准确性和鲁棒性。此外,DoReMi数据集还可以用于其他相关领域的研究,如音乐信息检索、音乐教学和创作等。DoReMi数据集的出现,为OMR研究提供了新的数据基础,有望推动OMR技术的进一步发展,并为其他相关领域的研究提供新的思路和方法。
数据集最近研究
最新研究方向
DoReMi数据集的发布标志着光学音乐识别(OMR)领域的一个重要进展,它为研究者提供了一个包含丰富元数据和多种音乐表示形式的全面数据集。该数据集不仅易于与现有的DeepScores和MUSCIMA++数据集进行融合,还提供了可播放音符、五线谱线、谱号、连音线和延音线的语义信息,这对于OMR研究中的重建阶段至关重要。DoReMi数据集的设计旨在支持端到端的深度学习系统,这已成为OMR领域的最新研究方向。通过提供不同类型的音乐表示,如MusicXML、MIDI、MEI和PNG图像,以及OMR元数据,DoReMi数据集为研究者提供了广泛的研究可能性。此外,该数据集在对象检测方面取得了显著的成果,平均精度(mAP)达到了64%,这表明其在OMR领域的实用性和潜力。DoReMi数据集的发布推动了OMR研究向前发展,为创建标准化的、通用的OMR数据集和评估框架奠定了基础,并为研究者提供了探索深度学习在OMR中应用的丰富资源。
相关研究论文
  • 1
    DoReMi: First glance at a universal OMR dataset伦敦玛丽女王大学数字音乐中心 · 2021年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作