RADIF CORPUS
收藏arXiv2025-07-15 更新2025-08-15 收录
下载链接:
https://zenodo.org/records/15742125
下载链接
链接失效反馈官方服务:
资源简介:
RADIF CORPUS 是一个代表完整非度量伊朗古典音乐曲目的数字语料库,涵盖了这个曲目的所有 13 个现有部分。它提供了约 281 分钟的 MIDI 文件以及数据电子表格,描述了 228 首音乐的音符、音符持续时间、间隔和层次结构。该语料库为伊朗古典音乐的计算机研究提供了一个平台,研究人员可以利用它来研究旋律模式、研究即兴风格,或用于音乐信息检索、音乐理论和计算机(民族)音乐学的其他任务。
The RADIF CORPUS is a digital corpus representing the complete non-metric repertoire of Iranian classical music, encompassing all 13 existing sections of this repertoire. It provides approximately 281 minutes of MIDI files alongside data spreadsheets that detail the notes, note durations, pitch intervals, and hierarchical structures of 228 musical works. This corpus serves as a foundational platform for computational research on Iranian classical music, enabling researchers to study melodic patterns, improvisational styles, or apply it to tasks such as music information retrieval, music theory, and other endeavors in computational (ethno)musicology.
提供机构:
爱尔兰高威大学
创建时间:
2025-07-15
搜集汇总
数据集介绍

构建方式
RADIF CORPUS数据集基于伊朗古典音乐的非节拍性传统,通过手工转录Mīrzā 'Abdollāh的radif乐谱构建而成。数据集涵盖了13种dastgāh/āvāz类别的228首非节拍性乐曲,采用MIDI、CSV和MusicXML三种格式存储,精确记录了包括微音分音高、音符时长、音程及层级结构在内的音乐要素。转录过程严格遵循Dariush Talai的乐谱版本,确保了音乐信息的准确性和完整性。
特点
该数据集的核心特点在于其完整呈现了伊朗古典音乐的非节拍性本质与微音分体系。数据集包含43,441个音符的MIDI文件(总时长约281分钟),通过四分音符号(Koron/Sori)和MIDI弯音技术精准还原波斯音阶特性。每首乐曲均标注层级化结构(以树状括号表示),并附有音高直方图、音程统计及旋律轮廓图,为分析seyr(旋律演进)和shāhed(中心音)功能提供可视化支持。其独特的非西方音乐语法和跨dastgāh的相似性矩阵,为比较音乐学研究创造了条件。
使用方法
研究者可通过Zenodo平台获取该数据集(DOI:10.5281/zenodo.15742125),采用CC-BY 4.0许可协议。音乐信息检索领域可基于MIDI文件开发旋律模式识别算法,计算音乐学可运用CSV中的层级数据研究即兴演奏结构,而MusicXML文件支持微音分记谱法的可视化分析。配套提供的音高热力图与复杂度指标(如标准化PAI)适用于音乐认知研究,Damerau-Levenshtein相似度矩阵则能辅助跨文化音乐风格比较。使用时需注意部分音乐软件对非节拍记谱和四分音播放的支持限制。
背景与挑战
背景概述
RADIF CORPUS是由Maziar Kanani、Sean O'Leary和James McDermott等研究人员于2025年推出的首个数字化非节拍伊朗古典音乐符号数据集,专注于伊朗古典音乐的核心曲目系统radif。该数据集涵盖了radif全部13个组成部分的228首非节拍乐曲,以MIDI文件、CSV表格和MusicXML格式呈现,精确记录了包括四分之一音在内的微音高信息及非节拍节奏结构。作为伊朗艺术音乐理论体系dastgāhi music的载体,radif在17至19世纪通过口传心授形成,其现代标准化版本由音乐家Mīrzā 'Abdollāh整理,现已成为伊朗音乐教育体系的基石。该数据集的建立填补了中东地区传统音乐计算研究的空白,为音乐信息检索、计算民族音乐学和跨文化音乐比较研究提供了关键资源。
当前挑战
构建RADIF CORPUS面临双重挑战:在领域问题层面,伊朗古典音乐特有的非节拍节奏系统(依赖音符间比例关系而非固定节拍)与24分音律制对现有计算分析方法构成挑战,传统音乐信息检索工具难以直接适用;在构建技术层面,需解决微音高符号化(如Koron/Sori记号)的MIDI编码问题,开发非节拍音乐的时值表示方法(如复杂拍号替代方案),并处理乐谱转录中装饰音省略与层次结构标注的平衡问题。此外,数据集需保持对波斯音乐核心概念(如shāhed焦点音)的忠实表达,同时适应计算分析需求,这对音乐学知识与计算机科学的跨学科协作提出了较高要求。
常用场景
经典使用场景
RADIF CORPUS作为首个涵盖伊朗古典音乐非韵律性radif完整曲目的数字符号数据集,其经典使用场景聚焦于音乐信息检索领域的旋律模式分析。该数据集通过228首乐曲的MIDI文件及结构化注释,为研究者提供了分析伊朗古典音乐中独特的非韵律节奏、微分音高及层次化旋律结构的标准化平台。在音乐理论研究中,学者可基于该数据集对dastgāh系统的13个子类别进行跨模态比较,特别是研究shūr、segāh等主要调式与附属āvāz调式之间的旋律演进关系。
实际应用
在实际应用层面,RADIF CORPUS为智能音乐创作系统提供了伊朗传统音乐的素材库。音乐科技开发者可利用其MIDI数据训练生成模型,实现符合波斯音乐美学的自动作曲;教育领域可基于该数据集开发交互式学习工具,帮助学习者掌握radif的即兴演奏规则;在文化遗产保护方面,数字化保存的微分音高信息为复原传统乐器演奏技法提供了精确参照。其MusicXML文件格式更推动了专业制谱软件对波斯音乐特殊记谱法的兼容性改进。
衍生相关工作
该数据集已衍生出多个经典研究方向:在音乐模式识别领域,研究者基于其相似性矩阵开发了跨文化音乐比较算法;计算创造力领域利用其层次化结构探索了波斯音乐的语法生成规则;人工智能音乐生成方面,已有工作将其与土耳其Makam数据集进行联合训练以提升模型的多文化适应性。此外,数据集提供的PAI复杂度指标启发了对非西方音乐系统复杂性测量的新方法论,相关成果被扩展应用于阿拉伯Maqām音乐的分析体系构建。
以上内容由遇见数据集搜集并总结生成



