OTMM Makam Recognition Dataset

github2024-03-19 更新2024-05-31 收录

下载链接：

https://github.com/MTG/otmm_makam_recognition_dataset

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集用于测试奥斯曼-土耳其音乐中的makam识别方法，包含20种最常见makam的50个录音，是目前最大的makam识别数据集。

This dataset is designed for testing makam recognition methods in Ottoman-Turkish music. It comprises 50 recordings of the 20 most common makams, making it the largest dataset currently available for makam recognition.

创建时间：

2015-07-15

原始信息汇总

OTMM Makam Recognition Dataset 概述

数据集描述

目的：测试奥斯曼-土耳其makam音乐的makam识别方法。
组成：包含20个最常见的makam，每个makam有50个录音，总计1000个录音。
来源：选自CompMusic Projects Dunya的奥斯曼-土耳其makam音乐收藏。
当前状态：目前是最大的makam识别数据集。

数据内容

录音标识：每个录音有一个16字符的唯一标识符（MBID），存储在MusicBrainz。
注释信息：makam和音调信息存储在annotations.json文件中。
音频数据：由于版权原因，不提供音频文件。提供的是通过先进算法计算的主要旋律，存储为文本文件，格式为data/[makam]/[mbid].pitch，包含频率值。
元数据：录音的元数据从MusicBrainz爬取，存储为data/[makam]/[mbid].json。

工具与算法

主要旋律提取算法：使用优化的算法提取主要旋律，详细信息见此链接。
工具：MORTY，一个模式识别和音调识别工具箱，可用于任何模式音乐文化。

许可证

许可证：Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License。

错误与更新

2020年4月：替换了两份不存在于CompMusic Dunya makam corpus的录音，并修正了dunya_uid。
2016年11月：发现音调注释的几个差异，建议使用otmm_tonic_dataset中的音调注释。

搜集汇总

数据集介绍

构建方式

OTMM Makam Recognition Dataset的构建过程体现了对奥斯曼-土耳其音乐文化的深入理解与尊重。该数据集从CompMusic项目的Dunya奥斯曼-土耳其Makam音乐收藏中精选了20种最常见makam的50首录音，确保了音乐形式、声乐/器乐配置以及录音质量的多样性。每首录音均通过MusicBrainz平台分配了一个16字符的唯一标识符（MBID），并在annotations.json文件中详细标注了makam和主音。由于版权限制，数据集未直接提供音频文件，而是通过优化的旋律提取算法生成了每首录音的主旋律频率值，并保存为文本文件。

特点

OTMM Makam Recognition Dataset作为目前最大的makam识别数据集，其显著特点在于其全面性和多样性。数据集涵盖了20种常见makam的1000首录音，每首录音均经过精心挑选，以确保音乐形式的多样性和录音质量的代表性。数据集不仅提供了每首录音的主旋律频率值，还通过MusicBrainz平台获取了详细的元数据，包括录音的标题、艺术家、专辑等信息。此外，数据集还提供了用于生成数据的算法版本信息，确保了研究的可重复性。

使用方法

使用OTMM Makam Recognition Dataset时，研究人员可通过annotations.json文件获取每首录音的makam和主音信息。数据集的主旋律频率值保存在文本文件中，路径为data/[makam]/[mbid].pitch，研究人员可根据需要重新计算时间戳。元数据文件则以JSON格式保存，路径为data/[makam]/[mbid].json。此外，数据集还提供了MORTY工具箱，用于模式识别和主音识别，研究人员可在此基础上进行进一步优化和扩展。使用数据集时，请务必引用相关文献，并遵守Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License的许可条款。

背景与挑战

背景概述

OTMM Makam Recognition Dataset 是由 CompMusic 项目团队于2016年创建的，旨在为奥斯曼-土耳其马卡姆音乐的识别方法提供测试数据。该数据集由来自20种最常见马卡姆的50首录音组成，是目前最大的马卡姆识别数据集。主要研究人员包括 A. Karakurt、S. Şentürk 和 X. Serra，他们的研究成果发表在《MORTY: A Toolbox for Mode Recognition and Tonic Identification》一文中。该数据集不仅涵盖了多样化的音乐形式、声乐/器乐设置以及录音质量，还通过 MusicBrainz 提供了每首录音的唯一标识符和详细的元数据。这一数据集为马卡姆音乐的研究和算法开发提供了重要的基础资源，推动了音乐信息检索领域的发展。

当前挑战

OTMM Makam Recognition Dataset 在构建和应用过程中面临多重挑战。首先，马卡姆音乐的复杂性使得自动识别和分类变得困难，尤其是在处理多样化的音乐形式和录音质量时。其次，由于版权限制，数据集无法直接提供音频文件，而是通过提取主旋律频率值来替代，这在一定程度上限制了数据的完整性和可用性。此外，数据集在构建过程中遇到了注释不一致的问题，尤其是在音调标注方面，需要通过额外的数据集进行修正。这些挑战不仅影响了数据集的构建过程，也对后续的研究和应用提出了更高的技术要求。

常用场景

经典使用场景

OTMM Makam Recognition Dataset 主要用于测试和验证奥斯曼-土耳其马卡姆音乐的识别方法。该数据集包含了来自20种最常见马卡姆的50个录音，涵盖了多样的音乐形式、声乐/器乐设置以及录音质量。研究者可以通过该数据集进行马卡姆识别算法的开发与优化，特别是在模态音乐文化中的模式识别和主音识别任务中，该数据集提供了丰富的实验材料。

解决学术问题

该数据集解决了模态音乐文化中马卡姆识别的关键学术问题。通过提供大量多样化的录音和详细的注释，研究者能够更准确地分析和理解马卡姆音乐的结构与特征。此外，数据集中的主旋律提取算法和元数据信息为模态音乐的自动分析提供了可靠的基础，推动了音乐信息检索领域的研究进展。

衍生相关工作

基于 OTMM Makam Recognition Dataset，研究者开发了多种相关工具和算法，其中最著名的是 MORTY 工具箱。MORTY 是一个用于模式识别和主音识别的工具箱，适用于任何模态音乐文化。此外，该数据集还催生了一系列关于马卡姆音乐自动分析和音乐信息检索的研究论文，进一步推动了该领域的发展。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集