five

Florence Price Art Song Dataset

收藏
github2025-06-28 更新2025-07-02 收录
下载链接:
https://github.com/TT515/Florence_Price_Art_Song_Dataset
下载链接
链接失效反馈
官方服务:
资源简介:
该存储库提供了作曲家Florence B. Price的112首歌曲的手工转录数据集,这些转录是从手稿来源手动转录到MuseScore中的。数据集包含完整的元数据,如节奏、作词人、主观情绪注释等,并提供了MuseScore文件、MIDI和MusicXML文件、PDF乐谱、歌词文本等。

This repository provides a manually transcribed dataset of 112 songs by composer Florence B. Price, with all transcriptions manually created from their original manuscript sources in MuseScore. The dataset includes comprehensive metadata such as tempo, lyricists, subjective emotional annotations, and offers MuseScore files, MIDI and MusicXML files, PDF sheet music, lyric text files, and other relevant supporting materials.
创建时间:
2025-06-23
原始信息汇总

Florence Price Art Song Dataset 概述

数据集基本信息

  • 名称: Florence Price Art Song Dataset
  • 关联论文: "The Florence Price Art Song Dataset and Piano Accompaniment Generator" (ISMIR 2025)
  • 数据量: 112首歌曲
  • 来源:
    • University of Arkansas – David W. Mullins Library
    • University of Pennsylvania – Kislak Center for Special Collections, Rare Books, and Manuscripts

数据集结构

主文件夹 price_songs_main/ (107首完整歌曲)

  • 子分类:

    1. Original Compositions: 95首Price原创歌曲
    2. Arrangements: 11首Price改编歌曲(主要为非洲裔美国民歌)
    3. Thourt My Loved One: 1首为声乐、钢琴和小提琴创作的歌曲(仅包含.mscz文件)
  • 文件内容:

    • MuseScore文件 (.mscz)
    • MIDI和MusicXML文件
    • 数字化乐谱PDF
    • 纯文本歌词
    • 两个标注者提供的节拍边界"onsets"文件
    • 元数据文件(包含速度、作词者、主观情绪标注等)

不完整歌曲文件夹 price_songs_incomplete/ (5首歌曲)

  • 仅包含.mscz文件

音频文件

  • 提供audio_script.py脚本用于生成音频文件(渲染全部112首歌曲约需1小时)

特殊说明

  • 重复段落歌曲: 12首歌曲包含重复段落,提供基于书面演奏值的四种"onsets"文件
  • 乐器标注: 使用双簧管替代人声部分

版权状态

公共领域作品

  • 1930年前发表
  • 未发表作品(2024年1月1日进入美国公共领域)

因版权风险被排除的歌曲

  • 17首歌曲被排除(包含12首原创作品和5首改编作品)

许可信息

  • 许可证: Creative Commons Zero (CC0)
  • 引用要求: 使用本数据集发表研究成果需引用关联ISMIR 2025论文

贡献邀请

  • 欢迎对数据集进行改进和贡献,请联系论文作者
搜集汇总
数据集介绍
main_image_url
构建方式
Florence Price艺术歌曲数据集的构建基于对Florence B. Price手稿的精细转录工作,主要来源于阿肯色大学和宾夕法尼亚大学的珍贵馆藏。研究团队采用MuseScore软件对112首歌曲进行人工数字化处理,其中107首为完整作品,5首因手稿残缺仅保留基础文件。每首歌曲不仅包含标准乐谱文件(MuseScore、MIDI、MusicXML格式),还附有歌词文本、节拍边界标注以及包含速度、作词者、情绪标签等丰富元素的元数据文件。特别值得注意的是,团队严格遵循美国版权法规,排除了17首可能存在版权风险的曲目,确保数据集的合法使用性。
使用方法
研究者可通过GitHub仓库获取结构化存储的乐谱文件,使用配套Python脚本批量生成音频样本以构建多模态分析数据集。标注文件支持音乐结构分析和分段特征提取,而丰富的元数据字段便于实施基于语义标签的内容检索。数据集特别适用于钢琴伴奏生成算法的训练与验证,相关Colab示例已提供模型实现框架。需注意渲染全部音频需约1小时计算时间,建议根据研究需求选择性生成。所有素材遵循CC0许可协议,允许无限制的学术与商业应用,但需引用配套ISMIR 2025论文以符合学术规范。
背景与挑战
背景概述
Florence Price Art Song Dataset是一个专注于音乐信息检索领域的数据集,由T. He、M. E. Malandro和D. Shadle等研究人员在2025年创建,并作为ISMIR 2025会议论文的配套资源发布。该数据集收录了112首由非裔美国作曲家Florence B. Price创作的艺术歌曲,这些歌曲从阿肯色大学和宾夕法尼亚大学的手稿中手工转录而来。数据集的核心研究问题在于探索艺术歌曲的钢琴伴奏生成以及音乐风格分析,为音乐信息检索、计算音乐学和音乐教育等领域提供了宝贵的资源。Florence Price作为20世纪重要的非裔女性作曲家,其作品的数字化和开源化不仅填补了音乐数据集的空白,也为研究非裔美国音乐文化提供了重要素材。
当前挑战
Florence Price Art Song Dataset面临多方面的挑战。在领域问题层面,艺术歌曲的钢琴伴奏生成需要解决音乐结构与情感表达的复杂对应关系,尤其是Price作品中融合的非洲裔音乐元素与西方古典音乐形式的独特结合。数据集构建过程中,研究人员需克服手稿转录的准确性难题,包括音符识别、节奏解析和动态标记等音乐符号的数字化。版权问题亦构成显著障碍,尽管部分作品已进入公有领域,仍有17首因版权风险被排除。此外,数据集标注的完整性受限于人工标注资源的不足,尤其是音乐情感和风格等主观维度的标注一致性亟待提升。音频文件的生成效率问题(需约1小时渲染全部歌曲)也为实际应用带来技术挑战。
常用场景
经典使用场景
Florence Price艺术歌曲数据集作为音乐信息检索领域的重要资源,其经典使用场景聚焦于计算音乐学与数字人文研究的交叉领域。该数据集收录的112首Florence Price手稿转录作品,为研究者提供了分析20世纪非裔美国作曲家艺术歌曲风格的标准化素材。在音乐结构分析研究中,标注的节拍边界与主观情绪标签使该数据集成为音乐情感计算任务的理想基准,特别是针对重复段落处理的四种onset文件设计,为音乐表演实践研究提供了独特视角。
解决学术问题
该数据集有效解决了音乐学研究中历史文献数字化与结构化处理的难题,通过系统整理Florence Price散落于多所大学档案馆的手稿,建立了首个完整的作曲家艺术歌曲数字典藏。其包含的元数据标注体系(包括速度、作词者、情绪标签等)为音乐风格迁移研究提供了监督信号,而钢琴伴奏生成器的配套开发则推动了音乐生成领域在特定作曲家风格建模方面的进展。这种多模态数据组织方式突破了传统音乐分析受限于乐谱单一维度的研究瓶颈。
实际应用
在音乐教育领域,该数据集支持智能伴奏系统的开发,通过MIDI与MusicXML格式的兼容性,可直接集成于数字音乐教学平台。文化保护机构利用其CC0许可特性,将这批公共领域作品转化为可交互的数字遗产。音乐科技公司则基于音频渲染脚本生成的合成录音,开发具有历史风格感知的智能作曲助手,特别是在爵士与灵歌风格的自动编曲应用中展现出独特价值。
数据集最近研究
最新研究方向
在音乐信息检索领域,Florence Price Art Song Dataset的推出为研究非裔美国女性作曲家Florence Price的艺术歌曲提供了宝贵资源。该数据集不仅包含112首手工转录的乐谱,还附带了丰富的元数据,如情感标注和音乐风格分类,为音乐生成、情感计算和风格分析等前沿研究提供了基础。特别是伴随数据集发布的钢琴伴奏生成器,展示了AI在音乐创作辅助方面的潜力,引发了关于算法作曲与人类创造力结合的讨论。随着2024年Price未发表作品进入公有领域,该数据集在音乐版权研究、数字人文和音乐遗产保护方面也具有重要意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作