five

Florence Price Art Song Dataset

收藏
arXiv2025-06-29 更新2025-07-02 收录
下载链接:
https://github.com/TT515/Florence_Price_Art_Song_Dataset
下载链接
链接失效反馈
官方服务:
资源简介:
弗洛伦斯·普莱斯艺术歌曲数据集包含了112首由作曲家弗洛伦斯·普莱斯创作的艺术歌曲,以MuseScore、MusicXML、MIDI和PDF格式提供。这些歌曲融合了她独特的音乐风格和对非洲裔美国民间歌曲的重新编排,为音乐学研究、表演和教育提供了丰富的资源。该数据集的创建旨在通过数字化的方式,提高公众对普莱斯音乐作品的访问,并促进对她的生活和创作风格的研究。同时,该数据集还支持生成音乐模型的研究,通过训练生成反映普莱斯风格的钢琴伴奏,为音乐创作和教育提供了新的可能性。

The Florence Price Art Song Dataset includes 112 art songs composed by American composer Florence Price, and is provided in MuseScore, MusicXML, MIDI, and PDF formats. These works integrate her distinctive musical style and reworkings of African American folk songs, serving as a rich resource for musicological research, performance, and education. The dataset was developed to enhance public access to Price’s musical works through digitalization, and to promote research into her life and compositional style. Additionally, the dataset supports research on generative music models: by training to generate piano accompaniments that reflect Price’s stylistic characteristics, it provides new possibilities for musical composition and education.
提供机构:
范德堡大学
创建时间:
2025-06-29
原始信息汇总

Florence Price Art Song Dataset 概述

数据集基本信息

  • 数据量: 112首歌曲
  • 作曲家: Florence B. Price
  • 来源: 手稿转录自以下机构:
    • University of Arkansas – David W. Mullins Library
    • University of Pennsylvania – Kislak Center for Special Collections, Rare Books, and Manuscripts
  • 格式: MuseScore文件 (.mscz)、MIDI、MusicXML、PDF、歌词文本、onset文件、metadata文件

数据集结构

📁 price_songs_main/ (107首完整歌曲)

  • 子文件夹分类:

    1. Original Compositions: 95首Price原创歌曲
    2. Arrangements: 11首Price改编的非洲裔美国民歌
    3. Thourt My Loved One: 1首为声乐、钢琴和小提琴创作的歌曲(仅包含.mscz文件)
  • 文件内容:

    • MuseScore文件 (.mscz)
    • MIDI和MusicXML文件
    • 数字化乐谱PDF
    • 歌词文本
    • 两个onset文件(标注小节边界)
    • metadata文件(包含速度、作词人、主观情绪标注等)

音频文件

  • 提供audio_script.py脚本用于生成音频文件(渲染全部112首歌曲约需1小时)

📁 price_songs_incomplete/ (5首不完整歌曲)

  • 仅包含.mscz文件

编辑乐谱

  • 3首乐谱由Owain Evans以CC0许可排版:
    • Travels End
    • Forever
    • Fantasy in Purple
  • 其余乐谱由第一作者排版

符号细节

  • 使用双簧管替代声部(与OpenScore Lieder Corpus等数据集一致)

包含重复的歌曲

  • 列出12首包含重复的歌曲(如City Called Heaven等)

美国版权状态

🟢 公共领域作品

  • 1930年前发表的作品
  • 未发表作品(2024年1月1日进入美国公共领域)

🔴 因版权风险被排除的歌曲

  • 列出17首被排除的原创作品和改编作品(如An April Day等)

许可

  • 采用Creative Commons Zero (CC0)许可
  • 引用论文: T. He, M. E. Malandro, D. Shadle. 2025. The Florence Price Art Song Dataset And Piano Accompaniment Generator. (Proceedings of the International Society for Music Information Retrieval Conference.)

贡献邀请

  • 欢迎对数据集进行改进和贡献(联系ISMIR 2025论文作者)
搜集汇总
数据集介绍
main_image_url
构建方式
Florence Price艺术歌曲数据集的构建基于对Price手稿的细致转录与数字化处理。研究者从阿肯色大学和宾夕法尼亚大学图书馆获取了129首歌曲的影印本,采用人工转录方式将原始乐谱转化为MuseScore格式,并进一步转换为MusicXML、MIDI和PDF等多种数字格式。由于光学音乐识别技术对Price特殊手写体乐谱的识别准确率不足,整个转录过程采用双重校验机制确保数据质量。在版权合规方面,团队严格筛选了2024年进入公有领域的112首作品,每首歌曲均包含乐谱文件、歌词文本、元数据标注及节奏分析文件,形成多模态音乐数据集。
特点
该数据集的核心价值在于其历史稀缺性与风格独特性。作为迄今最完整的Florence Price声乐作品数字典藏,它系统收录了这位非裔女性作曲家的112首艺术歌曲与民歌改编曲。Price作品以高度半音化和声、全音阶特征及朱巴舞节奏著称,数据集中每首歌曲均呈现其标志性的调性转换、节拍变化等创作特征。技术层面,数据集提供MuseScore源文件与三种通用音乐编码格式,配套的元数据包含情绪标注、风格分类及双专家判读的乐段划分标记,为音乐风格分析与生成模型训练提供了结构化标注基础。
使用方法
该数据集支持多维度的学术与应用研究。在音乐信息检索领域,研究者可利用MusicXML和MIDI格式进行旋律提取、和声分析等计算音乐学研究;音乐生成方向,数据集可作为特定作曲家风格建模的优质样本,如论文中基于T5架构微调的钢琴伴奏生成器。教育应用方面,配套的PDF乐谱与MuseScore文件可直接用于音乐表演教学。使用建议包括:通过GitHub仓库获取完整数据集时需注意17首未公开作品的版权限制;进行生成模型训练时推荐采用论文提出的留一法验证策略;音乐分析研究可结合元数据中的情绪标签与节奏标记进行跨作品对比研究。
背景与挑战
背景概述
Florence Price Art Song Dataset是由Vanderbilt University和Sam Houston State University的研究团队于2025年创建的,旨在数字化保存和分享20世纪早期非裔美国女性作曲家Florence Price的艺术歌曲作品。Price的作品融合了美国南方文化、非洲传统和西方古典音乐训练,具有独特的音乐风格。该数据集包含112首Price的艺术歌曲和民歌改编作品,以MuseScore、MusicXML、MIDI和PDF格式发布,是目前最完整的Florence Price声乐作品数字合集。数据集的创建不仅为音乐学研究提供了宝贵资源,也为音乐信息检索和生成模型的研究开辟了新方向。
当前挑战
Florence Price Art Song Dataset面临的主要挑战包括:1) 领域问题挑战:艺术歌曲伴奏生成需要精确捕捉Price独特的和声语言(如全音阶、增减和弦)和节奏特征(如Juba舞节奏),这对生成模型的风格模仿能力提出了极高要求;2) 构建过程挑战:原始手稿存在字迹不清、符号模糊等问题,导致光学音乐识别技术失效,研究人员不得不进行耗时的手工转录;同时部分作品因版权限制无法纳入数据集,影响了数据集的完整性。此外,小规模数据集(仅112首作品)对模型训练构成挑战,需要创新性的微调策略以避免过拟合。
常用场景
经典使用场景
Florence Price Art Song Dataset作为20世纪早期非裔美国女性作曲家Florence Price的艺术歌曲数字典藏,其经典使用场景集中于音乐信息检索领域。该数据集通过提供112首声乐作品的MuseScore、MusicXML、MIDI和PDF多格式编码,为研究者分析Price融合美国南方民间音乐、非洲音乐元素与西方古典技法的独特风格提供了结构化数据基础。在符号音乐生成任务中,该数据集特别适用于旋律-伴奏关系研究,因其完整收录了Price创作的声乐旋律线与钢琴伴奏谱。
衍生相关工作
该数据集催生了多个标志性研究方向:在生成模型领域,基于T5架构微调的伴奏生成器(FP模型)为小样本作曲家风格建模提供了新范式;其采用的韵律温度调控方法影响了后续研究如ProgGP对金属乐生成的工作。音乐学方面,数据集支撑了针对Price运用保罗·劳伦斯·邓巴诗歌的歌曲分析(Henderson Jr, 2025),并与OpenScore Lieder Corpus形成19-20世纪艺术歌曲的对比研究框架。技术层面,其手动转录方案为历史乐谱的光学识别失败案例提供了替代方案参考。
数据集最近研究
最新研究方向
Florence Price Art Song Dataset作为20世纪非裔美国女性作曲家Florence Price艺术歌曲的数字典藏,近期研究聚焦于音乐信息检索与生成式AI的交叉领域。通过将112首声乐作品编码为MuseScore、MusicXML等多模态格式,该数据集不仅填补了非裔作曲家作品数字化资源的空白,更成为研究特定作曲家风格建模的典型案例。前沿探索体现在基于Transformer架构的钢琴伴奏生成系统开发,该模型通过小样本微调技术成功捕捉Price标志性的全音阶运用、朱巴舞节奏等特征,在盲测实验中生成伴奏的风格辨识度显著优于基线模型(p<0.001)。这项研究推动了文化遗产数字化保护与AI音乐生成的深度融合,为音乐学分析提供了计算范式,同时在音乐教育、历史作品补全等应用场景展现出独特价值。
相关研究论文
  • 1
    The Florence Price Art Song Dataset and Piano Accompaniment Generator范德堡大学 · 2025年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作