IRMA Dataset (Iranian Radif MIDI Audio)
收藏arXiv2025-08-27 更新2025-08-29 收录
下载链接:
https://github.com/SepiSha/irma-dataset
下载链接
链接失效反馈官方服务:
资源简介:
IRMA数据集是一个多层次、开放获取的语料库,专为计算研究伊朗古典音乐而设计,特别强调radif——一种结构化的模式-旋律单元的集合,是教学和表演的核心。该数据集结合了符号MIDI表示、短语级音频-MIDI对齐、PDF格式的音乐学转录,以及从各种表演者和学者那里整理的比较理论信息表。目前的版本包括Karimi的完整radif;Mirz ̄a Abdoll ̄ah的radif的MIDI文件和元数据;Dav ̄ami的声乐radif的选段,由P ̄ayvar和Fereyduni转录;以及一个专门的部分,展示了20世纪杰出声乐家表演的tahrir装饰音的音频-MIDI示例。虽然符号和分析组件是在开放获取许可证(CC BY-NC 4.0)下发布的,但一些引用的音频录音和第三方转录是使用唱片目录信息引用的,以使用户能够独立定位原始材料,待版权许可。作为学术档案和计算分析的资源,该数据集支持应用于民族音乐学、教学法、符号音频研究、文化遗产保护以及自动转录和音乐生成等AI驱动任务。我们欢迎合作和反馈,以支持其持续改进并将其更广泛地集成到音乐学和机器学习中。
The IRMA Dataset is a multi-level, open-access corpus designed for computational research on Iranian classical music, with a special emphasis on radif—a structured collection of modal-melodic units that forms the core of teaching and performance. This corpus combines symbolic MIDI representations, phrase-level audio-MIDI alignments, musicological transcriptions in PDF format, and curated comparative theoretical information tables collected from various performers and scholars. Its current release includes the complete radif by Karimi; MIDI files and metadata for the radif of Mirzā Abdollāh; selected excerpts of the vocal radif by Davāmi, transcribed by Pāyvār and Fereyduni; and a dedicated section showcasing audio-MIDI examples of tahrir ornamentations performed by prominent 20th-century vocalists. While the symbolic and analytical components are distributed under the open-access license CC BY-NC 4.0, some cited audio recordings and third-party transcriptions are referenced via discographical information to allow users to independently locate the original materials pending copyright clearance. As a resource for academic archiving and computational analysis, this dataset supports applications spanning ethnomusicology, pedagogy, symbolic-audio research, cultural heritage preservation, and AI-driven tasks such as automatic transcription and music generation. We welcome collaborations and feedback to support its continuous improvement and broader integration into musicological and machine learning research.
提供机构:
Cu Test Inc.
创建时间:
2025-08-27
原始信息汇总
IRMA 数据集概述
数据集名称
IRMA Dataset(Iranian Radif MIDI Audio Dataset)
核心描述
IRMA 数据集是一个经过策划的伊朗古典音乐经典 radif 曲目库的符号化和分析表示集合。它包含声乐和器乐表演的结构化数据,重点关注 radif 传统多样演绎中的音高、能量、MIDI、对齐和 tahrir 装饰音。
数据内容
数据组成
- 作者生成的符号化转录(MIDI、MusicXML、PDF)
- 提取的音高和能量数据(CSV)
- 音频-MIDI 对齐数据(如可用)
- 音乐分析、直方图、功能注释、分段级别分析等
数据目录结构
- karimi/:Mahmoud Karimi 声乐 radif
- davami/:Abdollah Davami 声乐 radif
- mirza-abdollah/:基于 Mirzā ʿAbdollāh 的器乐 radif
- shajarian/:课堂录音和对齐的符号化数据
- kazemi/:Kazemi 声乐 radif 材料
- tahrir/:Tahrir 集合(多位艺术家)
- metadata/:数据集级别元数据(CSV、JSON 等)
- docs/:文档、许可证和通知文件
项目目标
- 支持音乐信息检索(MIR)研究
- 支持计算民族音乐学和跨文化分析
- 支持声乐装饰音建模
- 支持非西方音乐结构的机器学习方法
版权限制
包含内容
- 作者生成的符号化转录和分析数据
- 从可用录音中提取的派生音高和能量表示
- 句子级别的音频-符号对齐数据
不包含内容
- 来自出版或商业来源的原始音频录音
- 其他大师(如 Talā’i、Payvar)准备的完整转录
许可证
所有作者生成的内容均根据知识共享署名-非商业性 4.0 国际许可证(CC BY-NC 4.0)提供,除非另有说明。第三方材料的使用必须遵守其各自的版权条款。
致谢
- Mirza Abdollah Radif 的 MIDI 文件最初发布在 radif-Midi 代码库
- 感谢 Ardavan Khalij 在多个 dastgahs 的 gushes 分离方面的工作
引用信息
如需在研究或出版物中使用 IRMA 数据集,请引用: Sepideh Shafiei and Shapour Hakam. The IRMA Dataset: A Structured Audio–MIDI Corpus for Iranian Classical Music. In Proceedings of the 12th International Conference on Digital Libraries for Musicology (DLfM 2025), Seoul, South Korea. ACM, New York, NY, USA.
联系方式
- 邮箱:sepideh.shafiee@gmail.com
- 欢迎对元数据、文档或分析工具的贡献
搜集汇总
数据集介绍

构建方式
IRMA数据集的构建采用多阶段协同流程,融合音乐学严谨性与计算分析精确性。研究团队首先对卡里米(Karimi)声乐拉迪夫进行核心数字化,通过专业音乐制谱师使用Finale软件对原始乐谱进行精细重制,保留微音程修饰符号与演奏技法标记。随后采用动态时间规整算法实现音频与MIDI的短语级对齐,并构建包含达斯塔加赫体系、表演者信息、乐器类型的多维标识符编码系统,确保音乐单元的精确溯源与跨版本可比性。
特点
该数据集的核心特色在于其多层次结构化设计,同时涵盖符号化MIDI表征、音频-MIDI对齐数据、音乐学转录文档及理论比较表格。独特包含超过260个塔赫里尔(tahrir)装饰音样本,配备表演对齐的符号化注释与音高能量分析数据。数据集深度融合文化特异性元素,如库龙(koron)微音程标记与功能音角色标注(沙赫德、伊斯特等),并通过音高直方图、漂移图谱等计算分析增强音乐学可解释性。
使用方法
研究者可通过GitHub开放平台获取CC BY-NC 4.0许可的符号化数据与计算分析结果,开展伊朗古典音乐的模态分析、装饰音研究与计算民族音乐学探索。音频-MIDI对齐资源为自动转录、音高追踪算法提供基准真值,而理论比较表格支持表演实践与音乐理论的交叉验证。教育领域可借助短语级可视化分析工具进行传统音乐教学,文化遗产保护领域则可通过多版本拉迪夫对比研究追溯 oral tradition 的演变轨迹。
背景与挑战
背景概述
IRMA数据集由Sepideh Shafiei与Shapour Hakam于2016年启动构建,2025年正式发布,致力于伊朗古典音乐的计算音乐学研究。该数据集聚焦于拉迪夫(radif)这一核心教学与表演体系,整合了符号化的MIDI表征、短语级音频-MIDI对齐、音乐学转录文档及多源理论比较表格。作为首个涵盖完整大师拉迪夫且融合微音程与装饰音细节的结构化语料库,其推动了民族音乐学、文化遗产保护及人工智能音乐生成等跨领域研究的发展。
当前挑战
领域问题层面,IRMA需解决伊朗古典音乐中微音程调式识别、声乐装饰音(如tahrir)的量化分析,以及口头传统中表演变体与理论模型的对齐难题。构建过程中面临多重挑战:一是跨版本拉迪夫的命名不一致性与旋律内容歧义需人工校验;二是音频与符号数据的精准对齐需克服微音程弯音与节奏自由性带来的技术障碍;三是版权限制下原始音频与第三方转录材料的合规使用与分布式访问的平衡。
常用场景
经典使用场景
在伊朗古典音乐计算分析领域,IRMA数据集作为首个融合音频-MIDI对齐与符号化表征的多模态语料库,其经典应用场景聚焦于拉迪夫(radif)传统的计算音乐学研究。通过精确对齐的句子级音频与MIDI数据,研究者能够量化分析波斯音乐特有的微分音程、装饰音技法(如tahrir颤音)以及表演中的音高漂移现象,为传统口传心授的音乐体系建立可计算的分析框架。
衍生相关工作
基于IRMA数据集衍生的经典工作包括波斯钢琴语料库的扩展研究、达斯特加调式自动识别算法的优化,以及微分音程的聚类分析模型。其中Shafiei等人开发的Radif工具箱实现了音频与符号数据的多层级对齐,而Nikzat等人构建的KDC开放语料库则进一步丰富了达斯特加音乐的计算研究资源体系。
数据集最近研究
最新研究方向
随着数字音乐学和文化遗产保护的深度融合,IRMA数据集为伊朗古典音乐的模态分析与表演实践研究开辟了新路径。当前研究聚焦于基于音频-符号对齐的微音程智能识别技术,结合动态时间规整算法实现表演中微分音变化的精准提取,有效解决了传统记谱法无法捕捉的装饰性音高偏移问题。在声乐装饰音研究领域,数据集内超过260个塔赫里尔(tahrir)样本为声学特征建模提供了珍贵资源,推动了跨歌手风格比较与自动装饰音生成算法的发展。该数据集通过整合卡里米、米尔扎·阿卜杜拉等多位大师的拉德夫(radif)版本,为计算民族音乐学提供了首个兼具音乐学深度与机器学习兼容性的多模态语料库,显著促进了伊朗传统音乐在人工智能转录、模态分类和文化遗产数字化保存领域的跨学科应用。
相关研究论文
- 1The IRMA Dataset: A Structured Audio-MIDI Corpus for Iranian Classical MusicCu Test Inc. · 2025年
以上内容由遇见数据集搜集并总结生成



