five

The Aligned Continuo Realization Dataset (ACoRD)

收藏
arXiv2026-04-24 更新2026-04-25 收录
下载链接:
https://hdl.handle.net/11234/1-5963
下载链接
链接失效反馈
官方服务:
资源简介:
ACoRD是由查尔斯大学研究团队构建的首个数字低音即兴演奏符号化数据集,包含7位羽管键琴演奏者对5段乐谱各5次演绎的175条MIDI录音,每条录音平均含105个音符。数据集通过动态时间规整技术实现了演奏与乐谱的精确对齐,并创新性地采用griff表征来捕捉演奏中的和声结构特征。该数据集填补了巴洛克数字低音即兴演奏实证研究的空白,为音乐信息检索、演奏风格分析及历史演奏实践研究提供了重要基础,尤其有助于揭示约束性即兴创作中的个性化表达空间。

ACoRD is the first symbolic dataset of figured bass improvisation developed by the research team at Charles University. It comprises 175 MIDI recordings, with each of the 7 harpsichord performers delivering 5 renditions of each of the 5 musical scores, and each recording contains an average of 105 musical notes. The dataset achieves precise alignment between the recorded performances and the original scores via dynamic time warping (DTW) technology, and innovatively employs the Griff representation to capture the harmonic structural features embedded in the improvisations. This dataset fills a critical gap in empirical research on Baroque figured bass improvisation, serving as a foundational resource for music information retrieval, performance style analysis, and historical performance practice studies. It is particularly valuable for uncovering the individualized expressive spaces inherent in constrained improvisational creation.
提供机构:
查尔斯大学
创建时间:
2026-04-24
搜集汇总
数据集介绍
main_image_url
构建方式
ACoRD数据集的构建基于精心设计的实验流程,旨在捕捉巴洛克通奏低音即兴演奏的多元表现。数据集包含175份MIDI录音,这些录音由7位羽管键琴演奏者(包括专业人士与学生)对5段通奏低音谱面分别演奏5次而成。每段通奏低音的音符数量介于82至135之间,平均约105个音符。为了确保演奏与乐谱的精确对应,研究团队采用基于动态时间规整的自动对齐系统,将演奏音符与谱面音符逐一匹配,尤其保证了低音音符的对齐近乎完美,为后续的特征提取奠定了坚实基础。
特点
该数据集的核心特点在于引入了‘griff’这一创新性结构表征,将通奏低音演奏的触键模式转化为可量化分析的字符串序列。Griff通过时间窗口将同时出现的音符整合为向量,并将音高转换为与低音的音程关系,从而消除了调性差异,使得不同调性下的演奏模式可直接比较。数据集具有高度的结构化与层次性,支持从单音符的音程分布到连续griff的n-gram建模,词汇量从54种音程到逾万种三连griff不等。这种表征不仅保留了演奏的时间顺序,还捕捉了键盘演奏中典型的和弦模式与触键习惯,为风格分析提供了富含语义的视角。
使用方法
ACoRD数据集的使用方法围绕分类与风格分析展开。研究者首先为每份演奏构建griff类型频率分布,形成词袋矩阵作为特征空间,随后利用支持向量机(SVM)对演奏者进行分类。实验表明,线性核函数的SVM在griff表征上达到最优分类准确率,全数据集上可达87%,单首谱面最高达97%。此外,通过滑动窗口分割乐谱片段,可定位演奏者个人风格的局部特征,分析特定音符位置的griff类型多样性与分布差异。数据集还支持空griff过滤、不同窗口参数调节等预处理操作,适用于通奏低音演奏者身份识别、个人风格要素解析及历史风格比较等研究任务。
背景与挑战
背景概述
通奏低音(basso continuo)作为巴洛克时期即兴伴奏的核心传统,长久以来被计算音乐学领域所关注,然而其作为活跃表演艺术的实证研究却因缺乏高质量的演奏数据而长期停滞。为填补这一空白,Adam Štefunko与Jan Hajič jr. 等来自查理大学数学与物理学院的研究人员,于2025年创建了Aligned Continuo Realization Dataset(ACoRD)。该数据集首次以符号化格式(MIDI)记录了七位羽管键琴演奏者对五首通奏低音线各五次的演奏,共计175份实现,并通过动态时间规整(DTW)技术实现演奏与乐谱的精确对齐。ACoRD不仅为探究历史风格规则与当代演奏实践之间的张力提供了前所未有的实证基础,更推动了以数据驱动方法解析即兴演奏中个人风格印记的研究范式,对历史上知情表演运动及音乐信息检索领域产生了深远的影响。
当前挑战
ACoRD数据集面临的核心挑战在于多维度交织的复杂困境。首先,从领域问题来看,通奏低音演奏虽受历史规则约束,却为演奏者保留了一定的即兴空间,如何在高度受限的和声与声部进行框架下,从演奏数据中有效区分并量化个体风格,成为一项具有根本性的研究难题。其次,在数据集构建过程中,自动对齐系统虽能精准匹配低音音符,但在处理非低音的装饰性音符时仍存在偏差,这对后续特征提取的精确性构成挑战。此外,每位演奏者对同一乐谱的五次重复演奏可能内含不一致性,如何在捕捉稳定个人特征的同时,过滤随机的即兴变化,并在仅有七位演奏者、样本量有限的条件下,通过支持向量机(SVM)在滑动窗口中定位风格印记,仍是当前技术难以逾越的瓶颈。
常用场景
经典使用场景
在巴洛克音乐的历史演奏实践研究中,通奏低音作为一种即兴伴奏艺术,长期缺乏可供实证分析的演奏数据。ACoRD数据集提供了7位羽管键琴家对5条通奏低音线条的175份MIDI演奏录音,并通过动态时间规整算法实现了演奏与乐谱的精准对齐。该数据集最经典的使用场景是分析演奏者基于特定和弦模式(即格里夫)的即兴选择,通过将音高转换为与低音的相对音程并编码为序列字符串,研究者能够从微观层面量化演奏者如何在历史风格框架内做出个性化的和声与织体决策。这不仅为计算音乐学提供了首个标准化通奏低音演奏语料库,也使得原本依赖历史文献的理论推断得以通过真实演奏数据进行验证。
衍生相关工作
ACoRD数据集的出现直接催生了一系列关于音乐即兴表演个性识别的后续研究。基于格里夫表示法,有工作进一步探索了n-gram模型对演奏风格连续性的刻画能力,将格里夫序列中的二元组和三元组特征用于更精细的演奏者区分实验。该数据集还激发了针对通奏低音自动生成的改进方法,研究者尝试将格里夫分布作为约束条件融入深度学习模型,以生成更贴近真实演奏者习惯的和声进行。此外,ACoRD的对齐算法框架被迁移至其他巴洛克即兴体裁的分析中,例如对华彩乐段和装饰音演奏的实证研究。在音乐认知领域,数据集提供的性能特征被用于探索演奏者注意力分配规律,分析高变异性音符位置与演奏者经验水平之间的关联。
数据集最近研究
最新研究方向
当前围绕ACoRD数据集的前沿研究聚焦于巴洛克通奏低音演奏中个人风格的量化识别与实证分析。借助结构化的“griff”表示方法与支持向量机分类模型,研究者首次验证了在历史规则约束下不同演奏者仍能展现可辨识的个性化选择。这一方向不仅突破了传统音乐学仅依赖书面文献解析风格的局限,更将通奏低音从纯理论领域推向活态演奏数据的科学探索。通过分析griff类型分布与多样性的局部特征,研究揭示了个人风格在特定乐句中的可定位性,为理解即兴演奏中的创造性表达提供了新视角,亦为当代历史知情演奏实践提供了数据驱动的教学与风格传承依据。
相关研究论文
  • 1
    Beyond Rules: Towards Basso Continuo Personal Style Identification查尔斯大学 · 2026年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作