five

Pipa-Centric MIDI dataset

收藏
arXiv2025-10-28 更新2025-11-04 收录
下载链接:
https://github.com/wishzhai/NanyinHGNN
下载链接
链接失效反馈
官方服务:
资源简介:
本研究构建了一个以琵琶为中心的MIDI数据集,包含332首南音琵琶曲目,由专业音乐家演奏。该数据集采用NanyinTok进行编码,能够捕捉到传统南音演奏中的重要表演特征。通过将符号序列转换为异构图结构,该数据集能够有效地捕捉南音音乐的旋律、节奏和结构关系。该数据集的创建和应用旨在解决南音音乐传承和创新发展中的挑战,为教育、修复和互动创作等领域提供支持。

This study develops a pipa-centric MIDI dataset consisting of 332 Nanyin pipa pieces performed by professional musicians. Encoded with NanyinTok, this dataset can capture the key performance characteristics of traditional Nanyin performances. By converting symbolic musical sequences into heterogeneous graph structures, it effectively captures the melodic, rhythmic and structural relationships inherent in Nanyin music. The creation and application of this dataset aim to address the challenges in the inheritance, innovation and development of Nanyin music, providing support for fields such as education, music restoration and interactive composition.
提供机构:
泉州师范学院,厦门大学
创建时间:
2025-10-28
搜集汇总
数据集介绍
main_image_url
构建方式
在非物质文化遗产南音的保护与创新背景下,该数据集通过系统化采集332首由专业音乐家演奏的南音琵琶曲目构建而成。采用音频转MIDI技术结合人工校验,确保演奏细节的精确转录,并开发了专门标记体系NanyinTok,对音高、节奏及演奏技法进行结构化编码,完整保留了南音特有的装饰音与即兴表演特征。
特点
该数据集以琵琶为核心载体,深度呈现南音异音复调的音乐特质。其独特之处在于融合了工尺谱记谱体系与口传心授的演奏规则,通过异质图结构显式建模乐器间互动关系。数据集涵盖四类传统乐器的协同演奏数据,既包含骨干旋律的规范记录,又通过动态装饰音节点捕捉即兴表演的微妙变化,实现了静态乐谱与动态演绎的有机统一。
使用方法
基于该数据集的研究应用遵循两阶段生成框架:首先通过图神经网络重构骨干旋律,继而结合规则引导系统生成符合南音审美范式的装饰音。使用者可借助专用解码器将异质图数据转换为多轨MIDI,支持琵琶、三弦、洞箫、二弦的协同音乐生成。该框架特别引入特殊音符种子机制,通过温度控制采样平衡传统约束与创作自由度,为民族音乐的计算建模提供完整技术路径。
背景与挑战
背景概述
南音作为联合国教科文组织非物质文化遗产,承载着中国闽南地区自10世纪中叶传承至今的音乐实践,被誉为“中国音乐史的活化石”。2025年,泉州师范大学与厦门大学联合团队构建了以琵琶为核心的MIDI数据集,旨在通过计算音乐学方法解决南音记谱与口传心授间的传承矛盾。该数据集聚焦南音特有的支声复调体系,以工尺谱记录的骨干旋律为基础,结合琵琶、三弦、洞箫、二弦四类传统乐器的即兴装饰技法,为传统音乐的数字化保护与创新提供了重要基础。
当前挑战
南音数据集的构建面临双重挑战:在领域问题层面,需突破西方音乐数据主导的局限,精准建模南音支声复调中骨干旋律与即兴装饰的动态交互关系;在技术实现层面,需克服工尺谱缺乏节奏标记、装饰技法依赖口传的缺陷,通过异构图表征将演奏技巧、模态约束等隐性知识转化为可计算结构,并在数据稀缺条件下保持风格真实性。
常用场景
经典使用场景
在民族音乐计算研究领域,Pipa-Centric MIDI数据集为南音异音织体的生成建模提供了核心支撑。该数据集通过琵琶主导的MIDI转录,精准捕捉了南音四大传统乐器(琵琶、三弦、洞箫、二弦)在演奏同一骨干旋律时的装饰性变奏特征,成为研究中国传统音乐异音现象的首选数据资源。研究者利用该数据集训练异构图神经网络,能够有效模拟南音演奏中即兴装饰与规则约束的平衡关系,为计算民族音乐学提供了重要的实验基础。
实际应用
在文化遗产保护实践中,该数据集支撑的南音生成系统已展现出显著应用价值。通过将生成的MIDI序列转换为传统乐器演奏,该系统能够辅助南音教学中的装饰技法训练,为初学者提供标准化的演奏范例。在文化传播层面,基于数据集的生成模型可创作符合南音美学的新作品,既保持传统韵味又融入现代元素,为这一非物质文化遗产在当代社会的活化利用提供了技术支撑,有效拓展了传统音乐的生存空间。
衍生相关工作
该数据集的建立催生了一系列南音计算研究的重要成果。基于数据集开发的NanyinHGNN模型创新性地将装饰生成重构为异构图中的节点创建任务,启发了传统音乐的结构化建模思路。相关研究进一步衍生出面向南音特色的评估指标体系,包括装饰合理性评分和模态感知F1值等专用度量标准。这些工作不仅深化了对南音音乐系统的计算理解,更为其他口传传统的数字化保护提供了可借鉴的方法论框架。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作