otmm_tonic_dataset
收藏数据集概述
名称: otmm_tonic_dataset
描述: 该数据集包含古典奥斯曼-土耳其makam音乐音频录音的注释音调频率数据。数据集中的每个录音至少由一位专家注释,其中约半数录音由至少两位注释者进行注释。当乐谱可用时,应用乐谱指导的音调识别方法,并由人工验证结果。
数据量: 最新版本中约有2000个录音被注释。
数据验证: 2016年11月发现若干音调注释错误后,约45%的录音已通过人工注释者和/或乐谱指导的音调识别方法进行验证。目前,已验证2000个注释,并更改了约100个,相当于5%的人为错误率。
数据结构: 数据存储在JSON文件annotations.json中,组织为录音的字典。每个注释的录音通过MusicBrainz MBID唯一标识。注释存储为字典列表,每个注释包括注释频率、来源数据集、相关出版物、时间间隔、音调符号、注释者观察等信息。
引用信息: 若在工作中使用此数据集,请引用Şentürk, S. (2016)的博士论文。
版权与使用: 由于版权原因,数据集中的大多数录音无法共享。相关特征已计算并可在注册后从Dunya-makam下载。数据集根据Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License授权。
自动验证: 每次提交后,数据集中的注释通过Travis CI自动验证,包括检查所有注释是否在20音分内,以及确保已移除的注释不会被错误重新引入。
额外资源: 提供了一个Jupyter笔记本extras/statistics.ipynb,用于查看详细统计信息。已移除的录音列表存储在removed.json文件中。




