minst-dataset

github2021-09-13 更新2024-05-31 收录

下载链接：

https://github.com/faroit/minst-dataset

下载链接

链接失效反馈

官方服务：

资源简介：

音乐乐器声音的MNIST数据集，用于研究和分析音乐乐器声音的特征。

The MNIST dataset of musical instrument sounds, designed for the research and analysis of the characteristics of musical instrument sounds.

创建时间：

2016-05-25

原始信息汇总

minst-dataset 数据集概述

数据来源

University of Iowa - MIS
Philharmonia
RWC - Instruments

数据获取

提供“manifest”文件用于下载前两个数据集。
第三个数据集（RWC）需联系AIST获取。

数据下载命令

$ python scripts/download.py data/uiowa.json ~/data/uiowa $ python scripts/download.py data/philharmonia.json ~/data/philharmonia

音频分割

原始录音包含多个音符，建议在音符开始处分割录音以建立干净的数据集。
采用人机交互方法确定分割点。

数据收集与分割命令

$ python scripts/collect_data.py uiowa path/to/download uiowa_index.csv $ python scripts/segment_collection.py uiowa_index.csv uiowa_onsets segment_index.csv --method onsets --num_cpus -1 --verbose 50

注释校正

使用注释程序校正分割点。
主要快捷键：spacebar添加/移除标记，w保存标记，q不保存关闭，x保存并关闭。

搜集汇总

数据集介绍

构建方式

minst-dataset的构建过程始于从三个不同的独奏乐器数据集中获取原始音频数据，这些数据集包括爱荷华大学的MIS、Philharmonia以及RWC乐器数据集。通过提供的清单文件，用户可以下载前两个数据集，而RWC数据集则需要联系AIST获取。下载完成后，数据集通过脚本进行音频分割，特别是针对包含多个音符的音频文件，采用基于人类干预的起始点检测方法，确保分割的准确性。这一过程涉及使用特定的脚本进行数据收集、分割算法的应用以及人工校正分割点，最终生成一个干净且结构化的数据集。

特点

minst-dataset的特点在于其专注于音乐乐器声音的多样性，涵盖了从古典到现代的多种乐器类型。数据集通过精确的音频分割技术，确保了每个音符的独立性和清晰度，为音乐信息检索和机器学习研究提供了高质量的音频样本。此外，数据集的构建过程中融入了人类专家的校正环节，进一步提升了数据的准确性和可靠性，使其成为音乐分析和机器学习领域的重要资源。

使用方法

使用minst-dataset时，用户首先需要安装必要的依赖项，并通过提供的脚本从指定的数据源下载音频文件。随后，利用脚本对音频进行分割和标注，这一过程可以通过命令行工具完成，用户可以根据需要选择是否应用自动分割算法。分割后的音频文件可以通过图形用户界面进行人工校正，确保每个音符的起始点准确无误。最终，校正后的数据可以用于各种音乐分析和机器学习任务，如乐器识别、音符分类等。

背景与挑战

背景概述

minst-dataset是一个专注于音乐乐器声音的数据集，灵感来源于著名的MNIST手写数字数据集。该数据集由多个研究机构共同构建，包括爱荷华大学、伦敦爱乐乐团以及日本产业技术综合研究所（AIST）。数据集的核心研究问题在于如何通过机器学习技术对音乐乐器声音进行精确分类与识别。自创建以来，minst-dataset在音乐信息检索（MIR）领域产生了深远影响，为研究者提供了一个标准化的基准，推动了音乐信号处理与乐器识别技术的发展。

当前挑战

minst-dataset在构建与应用过程中面临多重挑战。首先，音乐乐器声音的多样性与复杂性使得数据集的标注与分割变得极为困难，尤其是在多音符录音中精确检测音符起始点的问题上，现有的起始点检测算法难以适应所有乐器类型。其次，数据集的构建依赖于多个来源的音频数据，这些数据的格式、质量与录制环境各不相同，导致数据预处理与标准化工作异常繁琐。此外，尽管采用了人机协作的方式进行数据标注，但人工干预的需求仍然较高，限制了数据集规模的扩展与自动化处理的可能性。

常用场景

经典使用场景

minst-dataset 数据集在音乐信息检索领域具有广泛的应用，特别是在音乐乐器声音的分类和识别任务中。研究者们利用该数据集训练机器学习模型，以区分不同乐器的声音特征，进而提升自动音乐转录和乐器识别的准确性。

衍生相关工作

minst-dataset 的发布催生了一系列相关研究，特别是在深度学习和音乐信号处理的交叉领域。许多经典工作基于该数据集开发了先进的乐器分类模型和音符检测算法，进一步推动了音乐信息检索技术的发展。

数据集最近研究