OpenSongSong
收藏arXiv2026-02-27 更新2026-03-03 收录
下载链接:
https://zcli-charlie.github.io/songsong/
下载链接
链接失效反馈官方服务:
资源简介:
OpenSongSong是由武汉大学联合沈阳音乐学院构建的首个中国古代宋词音乐数据集,包含多位宋词音乐大师创作的29.9小时高质量作品。该数据集填补了古乐谱数字化领域的空白,通过系统化采集历史文献中的工尺谱记谱法数据,经音乐学专家标注校验形成结构化数据。主要应用于人工智能辅助的古乐复原、传统音乐生成模型训练等领域,为传承中华传统音乐文化提供关键技术支撑。
提供机构:
武汉大学·航空航天信息安全与可信计算教育部重点实验室; 武汉大学·计算机学院; 武汉大学·信息管理学院; 沈阳音乐学院
创建时间:
2026-02-27
搜集汇总
数据集介绍
构建方式
在古风音乐生成领域,数据稀缺性构成了研究的主要瓶颈。OpenSongSong的构建过程体现了对传统宋词音乐的深度挖掘与系统整理。研究团队从多位宋词音乐大师的作品中精心采集,最终汇聚了总计29.9小时的音频素材。每段音频均配有详尽的文本网格标注,其中包含了歌词文本、音素序列与音高序列,且所有标注均与演唱音频精确对齐,便于提取每个元素的起止时间。此外,团队还将乐谱信息转换为MIDI格式,以数字化形式保留了音符的音高、时长与节奏等关键音乐特征,从而构建了一个兼具规模与深度的宋词音乐数据集。
使用方法
该数据集主要服务于古风音乐,特别是宋词音乐的生成与复原研究。使用者可借助其对齐的歌词、音素、音高及MIDI信息,训练端到端的歌词到旋律生成模型。具体而言,标注信息可直接用于训练演唱声音合成模型中的时长预测器与基频预测器;MIDI数据则为旋律建模与伴奏生成提供了结构化输入。研究实践表明,基于该数据集训练的模型,能够通过预测输入宋词的旋律,进而分别生成演唱人声与器乐伴奏,最终合成符合宋词传统风格的音乐作品,在主观与客观评估中均展现出对古风风格的精准捕捉能力。
背景与挑战
背景概述
在数字人文与计算音乐学交叉领域,古代音乐文化遗产的数字化复原面临严峻挑战。OpenSongSong数据集由武汉大学、沈阳音乐学院等机构的研究团队于2026年构建,旨在填补中国古代宋词音乐高质量数据集的空白。该数据集收录了总计29.9小时、由89位演唱者演绎的宋词音乐作品,涵盖了完整的汉语音素与广泛的音高分布,并提供了歌词、音素、音高对齐及MIDI乐谱等多维度标注。其核心研究问题是解决因古乐谱失传导致的宋词原初音乐形态湮没问题,通过提供大规模、结构化的宋词音乐语料,为基于深度学习的古曲生成与复原模型奠定数据基础,对推动中国传统音乐文化的计算化保存与创新性传承具有深远影响。
当前挑战
OpenSongSong数据集所应对的领域挑战在于古曲风格音乐的生成与复原。现有音乐生成模型多专注于现代流行歌曲,难以捕捉宋词音乐特有的单调重复节奏与固定句式结构,导致生成内容在音乐结构、配器风格上与古曲形神相悖。在数据集构建过程中,研究团队遭遇了多重困难:其一,历史流传的宋词音乐原始录音极为稀缺,且音质参差不齐,需从有限资源中筛选与修复高质量素材;其二,为实现歌词与旋律的精确对齐,需对古曲中复杂的韵律、音高及节奏模式进行精细化标注,标注工作专业性强且耗时巨大;其三,需确保数据集覆盖所有汉语音素及宋词中可能出现的生僻字发音,以支持模型准确演唱,这对数据收集的全面性与平衡性提出了极高要求。
常用场景
解决学术问题
OpenSongSong数据集有效解决了古代音乐复原中的若干学术难题。针对宋词音乐乐谱失传、风格独特的挑战,该数据集填补了公开古代中文音乐数据的空白,为基于深度学习的音乐生成研究提供了稀缺的训练资源。它支持歌词-旋律对齐、歌唱声音合成及伴奏生成等关键任务,促进了模型在低资源条件下对古典音乐风格的准确建模,推动了音乐信息学在文化遗产数字化领域的深入探索。
实际应用
在实际应用层面,OpenSongSong数据集为文化遗产保护与数字化传播提供了切实工具。基于该数据集训练的模型能够将古典宋词文本自动转化为具有相应风格的音乐作品,可用于教育平台、数字博物馆及文化创意产业,使公众能够以听觉形式体验古代文学的魅力。此外,该数据集支持的可控生成技术允许用户调整旋律与伴奏,为个性化音乐创作与古典艺术再创新提供了可能。
数据集最近研究
最新研究方向
在数字人文与计算音乐学的交叉领域,OpenSongSong数据集的推出标志着古代音乐复原研究迈入新阶段。该数据集聚焦于宋代词乐这一珍贵文化遗产,其前沿探索主要围绕多模态音乐生成模型的架构创新展开。研究者通过结合自回归Transformer与扩散模型技术,构建了从词文到旋律、再至演唱声与伴奏的端到端生成流程,有效解决了古乐谱缺失导致的风格失真问题。当前热点集中于提升模型对古词韵律结构的对齐能力,并在低资源条件下优化演唱的自然度与伴奏的乐器适配性。这一研究方向不仅推动了人工智能在文化遗产数字化保护中的应用,也为跨学科的音乐风格迁移与历史音声复原提供了可扩展的范式,具有深远的学术价值与文化意义。
相关研究论文
- 1SongSong: A Time Phonograph for Chinese SongCi Music from Thousand of Years Away武汉大学·航空航天信息安全与可信计算教育部重点实验室; 武汉大学·计算机学院; 武汉大学·信息管理学院; 沈阳音乐学院 · 2026年
以上内容由遇见数据集搜集并总结生成



