romantic_piano_corpus
收藏github2023-12-06 更新2024-05-31 收录
下载链接:
https://github.com/DCMLab/romantic_piano_corpus
下载链接
链接失效反馈官方服务:
资源简介:
这是一个包含多个子数据集的元数据集,涵盖了19世纪长时期的调性钢琴音乐,包括贝多芬的钢琴奏鸣曲、肖邦的马祖卡、德彪西的贝加马斯克组曲等。数据集提供了详细的版本历史、数据获取方式和数据格式说明,以及如何使用和阅读数据集中的元数据文件。
This is a meta-dataset comprising multiple sub-datasets, encompassing a vast collection of tonal piano music from the 19th century, including Beethoven's piano sonatas, Chopin's mazurkas, and Debussy's Suite Bergamasque, among others. The dataset provides comprehensive details on version history, data acquisition methods, and data format specifications, along with guidance on how to utilize and interpret the metadata files within the dataset.
创建时间:
2021-07-07
原始信息汇总
数据集概述
数据集名称
An Annotated Corpus of Tonal Piano Music from the Long 19th Century
数据集描述
该数据集由DCML corpus initiative创建,使用DCML harmony annotation标准,包含多个作曲家的钢琴音乐作品,具体包括:
- Ludwig van Beethoven - Piano Sonatas
- Frédéric Chopin - Mazurkas
- Claude Debussy - Suite Bergamasque
- Antonín Dvořák - Silhouettes
- Franz Liszt - Années de Pèlerinage
- Nikolai Medtner - Tales
- Robert Schumann - Kinderszenen
- Pyotr Tchaikovsky - The Seasons
- Edvard Grieg - Lyric Pieces
数据获取方式
包含完整版本历史
使用git命令克隆仓库: bash git clone --recurse-submodules -j8 https://github.com/DCMLab/romantic_piano_corpus.git
不包含完整版本历史
下载并解压各个子模块的ZIP文件。
数据格式
每个作品由四个文件组成,分别包含:
- Uncompressed MuseScore文件(包含音乐和注释标签)
- 音符头相关特征的表格文件
- 乐谱中相关信息的表格文件
- 包含和声标签(包括终止式和乐句)及其在乐谱中位置的列表文件
元数据文件说明
metadata.tsv包含以下信息:
- 文件信息
- 作品信息
- 乐谱信息
- 标识符信息
许可证
数据集遵循Creative Commons Attribution-NonCommercial-ShareAlike 4.0 (CC BY-NC-SA 4.0)许可证。
搜集汇总
数据集介绍

构建方式
浪漫主义钢琴音乐数据集(romantic_piano_corpus)由DCML语料库计划构建,涵盖了19世纪多位著名作曲家的钢琴作品。该数据集通过MuseScore软件对乐谱进行数字化处理,并采用DCML和声标注标准进行详细标注。每个作品包含四个文件,分别记录乐谱、音符信息、小节信息及和声标注,确保数据的全面性与准确性。
使用方法
用户可以通过Git克隆或下载ZIP文件获取数据集。数据集中的乐谱文件可使用MuseScore软件打开,TSV文件则可通过文本编辑器或编程语言(如Python)进行读取和分析。数据集还提供了详细的元数据文件(metadata.tsv),帮助用户快速了解每个作品的基本信息。对于需要进一步处理数据的用户,数据集还提供了生成TSV文件的命令行工具,便于自动化处理。
背景与挑战
背景概述
浪漫主义钢琴音乐数据集(Romantic Piano Corpus)由DCML实验室主导创建,旨在为19世纪钢琴音乐的和声分析提供高质量的标注数据。该数据集涵盖了贝多芬、肖邦、德彪西等多位作曲家的钢琴作品,采用DCML和声标注标准进行标注。这些标注不仅包括和弦、乐句和终止式等音乐元素,还提供了详细的音符、小节和元数据信息。该数据集的创建为音乐信息检索、音乐理论研究和机器学习在音乐领域的应用提供了重要的基础资源。
当前挑战
该数据集面临的挑战主要体现在两个方面。首先,音乐和声标注的复杂性使得标注过程需要高度的音乐理论知识和细致的分析能力,确保标注的准确性和一致性。其次,数据集的构建过程中,如何将不同格式的音乐乐谱(如MuseScore文件)转换为统一的TSV格式,并保持数据的完整性和可读性,是一个技术难题。此外,由于数据集涵盖了多位作曲家的作品,如何在不同风格和时期的音乐中保持标注标准的一致性,也是一个重要的挑战。
常用场景
经典使用场景
在音乐信息检索领域,romantic_piano_corpus数据集被广泛用于分析和研究19世纪浪漫主义时期的钢琴音乐作品。通过该数据集,研究者可以深入探讨和声结构、旋律发展以及音乐形式等音乐学问题。数据集中的详细注释和标准化格式为音乐分析提供了坚实的基础,使得研究者能够进行跨作品、跨作曲家的比较研究。
解决学术问题
该数据集解决了音乐学研究中长期存在的和声标注标准化问题。通过采用DCML和声标注标准,数据集为研究者提供了一个统一的框架,使得不同作品之间的和声分析具有可比性。此外,数据集还解决了音乐信息检索中的自动化分析难题,为机器学习模型提供了高质量的标注数据,推动了音乐信息检索技术的发展。
实际应用
romantic_piano_corpus数据集在实际应用中具有广泛的用途。音乐教育领域可以利用该数据集进行教学,帮助学生理解和声结构和音乐形式。音乐创作领域则可以通过分析这些经典作品,激发创作灵感。此外,该数据集还为音乐信息检索系统的开发提供了宝贵的资源,推动了音乐推荐、自动作曲等应用的发展。
数据集最近研究
最新研究方向
在音乐信息检索领域,romantic_piano_corpus数据集为研究19世纪钢琴音乐的和声结构、旋律发展及节奏模式提供了丰富的资源。近年来,研究者们利用该数据集进行深度学习模型的训练,特别是在自动和声分析与音乐生成方面取得了显著进展。通过结合自然语言处理技术,该数据集还被用于探索音乐与文本之间的跨模态关系,进一步推动了音乐情感计算和音乐推荐系统的发展。此外,该数据集的开源特性促进了全球研究者的合作,加速了音乐信息检索技术的创新与应用。
以上内容由遇见数据集搜集并总结生成



