Standardized Musical Form and Structure Analysis (SMFSA) Database

github2024-05-21 更新2024-05-31 收录

下载链接：

https://github.com/danielathome19/Form-NN

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集提供了200首古典音乐的形式分类和基于时间戳的分析，用于古典音乐形式识别和分析。

This dataset provides formal classification and timestamp-based analysis of 200 classical music pieces, intended for the recognition and analysis of classical music forms.

创建时间：

2021-12-22

原始信息汇总

数据集概述

数据集名称: Standardized Musical Form and Structure Analysis (SMFSA) Database

数据集描述: 该数据集包含200首独特的古典音乐作品的形式分类和基于时间戳的分析。它是Form-NN深度学习系统的一部分，该系统使用混合神经网络-决策树架构（TreeGrad和Bi-LSTM-Tree）进行音乐形式和部分/短语分析。

数据集内容:

MIDI数据: 存储在Data/MIDI目录中。
标签数据: 存储在Labels目录中，包括示例训练数据存储在Images目录中。
分析PDF: 可应要求提供。

数据集使用:

用户可以通过修改main.py中的main函数来选择模型执行的操作。
预训练权重存储在Weights目录中。

贡献指南:

用户可以通过分析音乐作品并提供分析结果来贡献数据集。
分析应遵循Douglass Green的**Form in Tonal Music: An Introduction to Analysis, 2nd Ed.**中介绍的分析技术。

许可证:

代码和数据集均使用CC0 License 1.0。

引用信息:

使用此数据集的研究应引用以下内容：
- 论文: "Deep Learning for Musical Form: Recognition and Analysis" 或 "A Novel Dataset and Deep Learning Benchmark for Classical Music Form Recognition and Analysis"
- 数据集: Standardized Musical Form and Structure Analysis (SMFSA) Database

搜集汇总

数据集介绍

构建方式

在音乐分析领域，Standardized Musical Form and Structure Analysis (SMFSA) Database的构建基于深度学习系统Form-NN，该系统结合了混合神经网络-决策树架构（如TreeGrad和Bi-LSTM-Tree）。数据集包含了200首独特的古典音乐作品，每首作品均经过形式分类和基于时间戳的分析。这些分析遵循Douglass Green在《Form in Tonal Music: An Introduction to Analysis, 2nd Ed.》中提出的标准化分析技术。数据集的构建过程包括从IMSLP等免费开放资源中收集音乐作品，并通过深度学习模型进行形式和部分的分析，最终生成带有时间戳的标签文件。

特点

SMFSA Database的显著特点在于其标准化和深度学习驱动的分析方法，确保了分析结果的一致性和准确性。数据集不仅提供了音乐作品的形式分类，还详细记录了每个部分的开始和结束时间，这对于音乐信息检索和音乐分析研究具有重要价值。此外，数据集的开放性和可扩展性使得研究人员和音乐理论家能够根据需要添加新的分析数据，进一步丰富和完善数据库内容。

使用方法

使用SMFSA Database时，用户可以通过访问GitHub页面下载数据集，其中包括MIDI文件、标签文件和预训练的权重。数据集的结构设计使得用户可以轻松地将这些文件与主程序main.py放置在同一目录下，并通过编辑main函数来选择模型执行的操作。用户还可以通过外部脚本调用数据集中的函数，如'get_total_duration'，以实现更灵活的操作。对于希望贡献分析数据的用户，可以通过联系数据集创建者获取分析指南和示例，进一步扩展数据集的内容。

背景与挑战

背景概述

在音乐信息检索领域，对古典音乐形式和结构的分析一直是研究的热点。Standardized Musical Form and Structure Analysis (SMFSA) Database 由Daniel Szelogowski主导，于2022年创建，旨在为古典音乐的形式和部分/段落分析提供标准化数据。该数据集包含了200首独特的古典音乐作品，提供了形式分类和基于时间戳的分析。SMFSA数据库不仅为深度学习系统Form-NN的训练提供了基础，还为音乐形式识别和分析的研究提供了新的基准。

当前挑战

尽管SMFSA数据库在古典音乐分析领域具有重要意义，但其构建过程中仍面临诸多挑战。首先，数据集的规模相对较小，仅包含200首作品，限制了模型的泛化能力。其次，音乐分析的标准化要求极高，需要具备深厚的音乐理论背景，这增加了数据标注的难度和复杂性。此外，数据集的更新和扩展依赖于社区的贡献，如何确保新加入数据的分析质量与一致性也是一个持续的挑战。

常用场景

经典使用场景

在音乐信息检索领域，Standardized Musical Form and Structure Analysis (SMFSA) Database 数据集的经典使用场景主要集中在古典音乐的形式和结构分析上。该数据集通过提供200首古典音乐作品的形式分类和基于时间戳的分析，为研究人员和开发者提供了一个标准化的资源，用于训练和验证音乐形式识别和分析的深度学习模型。例如，研究人员可以利用该数据集训练混合神经网络-决策树架构（如TreeGrad和Bi-LSTM-Tree），以实现对音乐作品的自动形式和部分/段落分析。

解决学术问题

SMFSA数据集在学术研究中解决了古典音乐形式和结构分析的自动化难题。传统上，音乐形式的识别和分析依赖于人工注释，耗时且易受主观影响。该数据集通过提供标准化的时间戳分析和形式分类，使得研究人员能够开发和验证自动化的音乐分析工具，从而推动了音乐信息检索领域的发展。此外，该数据集还为音乐理论研究提供了新的视角，通过机器学习方法揭示音乐作品的内在结构和形式特征，具有重要的学术意义和影响。

衍生相关工作

SMFSA数据集的发布催生了一系列相关的经典工作，特别是在音乐信息检索和深度学习领域。例如，基于该数据集的研究论文《Deep Learning for Musical Form: Recognition and Analysis》详细探讨了如何利用深度学习技术进行音乐形式的识别和分析，为后续研究提供了理论基础和实践指导。此外，该数据集还激发了多个深度学习模型的开发，如TreeGrad和Bi-LSTM-Tree，这些模型在音乐形式和结构分析中表现出色，成为该领域的标杆性工作。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集