OTMM Makam Recognition Dataset

github2024-03-19 更新2024-05-31 收录

下载链接：

https://github.com/MTG/ottoman_turkish_makam_recognition_dataset

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集用于测试奥斯曼土耳其makam音乐的makam识别方法，包含20个最常见makam的50个录音，是目前最大的makam识别数据集。

This dataset is designed for testing makam recognition methods in Ottoman Turkish makam music. It comprises 50 recordings of the 20 most common makams, making it the largest dataset currently available for makam recognition.

创建时间：

2015-07-15

原始信息汇总

OTMM Makam Recognition Dataset 概述

数据集描述

目的：测试Ottoman-Turkish makam音乐的makam识别方法。
组成：包含20个最常见的makam，每个makam有50个录音，总计1000个录音。
来源：从CompMusic Projects Dunya Ottoman-Turkish Makam Music collection中选取。

数据集内容

录音标识：每个录音有一个16字符的唯一标识符（MBID）。
makam和音调标注：标注信息存储在annotations.json文件中。
音频数据组织：按makam分类存储在data文件夹中。
音频特征：提供每个录音的主导旋律，存储为文本文件，包含频率值，无时间戳。
元数据：从MusicBrainz爬取，存储为JSON文件。

数据集工具与版本

算法版本记录：工具版本信息记录在algorithms.json文件中。
主导旋律提取算法：使用优化的算法，详细信息见此链接。

引用信息

引用文献：Karakurt, A., Şentürk S., & Serra X. (2016). MORTY: A Toolbox for Mode Recognition and Tonic Identification. 3rd International Digital Libraries for Musicology Workshop.

许可证

许可证：本数据集遵循Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License。

搜集汇总

数据集介绍

构建方式

OTMM Makam Recognition Dataset的构建基于CompMusic Project的Dunya奥斯曼-土耳其Makam音乐收藏，精心挑选了20种最常见makam的50首录音。这些录音涵盖了多样化的音乐形式、声乐/器乐配置以及录音质量（如历史与现代录音）。每首录音通过MusicBrainz中的16字符唯一标识符MBID进行标识，并在annotations.json文件中标注了makam和主音。由于版权限制，数据集未提供原始音频，而是通过优化的主旋律提取算法生成主旋律频率值，并以文本文件形式保存。

特点

该数据集是目前最大的makam识别数据集，包含1000首录音，覆盖了奥斯曼-土耳其音乐中最常见的20种makam。其特点在于录音的多样性和高质量标注，每首录音的主旋律频率值以文本文件形式提供，便于进一步分析。此外，数据集还提供了每首录音的元数据，包括从MusicBrainz爬取的信息，并以JSON格式保存。这些元数据为研究者提供了丰富的背景信息，有助于深入理解音乐内容。

使用方法

使用OTMM Makam Recognition Dataset时，研究者可通过annotations.json文件获取每首录音的makam和主音标注。主旋律频率值以文本文件形式存储，路径为data/[makam]/[mbid].pitch，可用于音高分析和模式识别。元数据文件data/[makam]/[mbid].json提供了录音的详细信息，如艺术家、专辑等。此外，研究者可结合MORTY工具箱进行模式识别和主音识别，进一步优化分析结果。数据集的使用需遵循CC BY-NC-SA 4.0许可协议，确保非商业用途并注明来源。

背景与挑战

背景概述

OTMM Makam Recognition Dataset 是由CompMusic项目团队于2016年创建的，旨在为奥斯曼-土耳其马卡姆音乐的识别方法提供测试数据。该数据集由来自20种最常见马卡姆的50个录音组成，涵盖了多样化的音乐形式、声乐/器乐配置以及录音质量。作为当前最大的马卡姆识别数据集，它显著推动了音乐信息检索领域的研究，特别是在模态音乐文化的自动识别与分析方面。数据集的核心研究问题在于如何通过计算模型准确识别马卡姆及其主音，这一挑战在传统音乐分析中具有重要意义。

当前挑战

OTMM Makam Recognition Dataset 在构建与应用过程中面临多重挑战。首先，马卡姆音乐的复杂性和多样性使得自动识别任务极具难度，尤其是在处理不同音乐形式和录音质量时。其次，由于版权限制，数据集无法直接提供音频文件，而是通过提取主旋律特征来替代，这在一定程度上限制了数据的完整性和可用性。此外，数据集在构建过程中还遇到了注释不一致的问题，特别是在主音标注方面，需要通过额外的工作进行修正。这些挑战不仅影响了数据集的构建效率，也对后续的研究应用提出了更高的技术要求。

常用场景

经典使用场景

OTMM Makam Recognition Dataset 主要用于测试和验证奥斯曼-土耳其马卡姆音乐的识别方法。该数据集包含了来自20种最常见马卡姆的50个录音，涵盖了多样化的音乐形式、声乐/器乐设置以及录音质量。研究人员可以利用该数据集进行马卡姆识别算法的开发与优化，特别是在模态音乐文化的背景下，探索音乐特征提取和模式识别的有效性。

解决学术问题

该数据集解决了模态音乐文化中马卡姆识别的关键学术问题。通过提供大量标注准确的录音数据，研究人员能够深入分析马卡姆音乐的音阶、调性和旋律特征，进而开发出更为精确的识别算法。这不仅推动了音乐信息检索领域的发展，还为跨文化音乐研究提供了重要的数据支持。

衍生相关工作

该数据集衍生了一系列经典工作，其中最著名的是MORTY工具箱，这是一个用于模态识别和调性识别的工具包，适用于任何模态音乐文化。此外，基于该数据集的研究还推动了音乐特征提取算法的发展，特别是在处理复杂音乐结构时，提供了新的思路和方法。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集