minst-dataset
收藏github2023-09-09 更新2024-05-31 收录
下载链接:
https://github.com/zhuwenxing/minst-dataset
下载链接
链接失效反馈官方服务:
资源简介:
这是一个将多个不同的独奏乐器集合整合成一个大型标准化数据集的项目,旨在方便机器学习的使用。简而言之,该项目旨在成为音乐音频处理的MNIST。
This project integrates multiple distinct solo instrument collections into a large-scale standardized dataset, designed to facilitate the use of machine learning. In essence, the project aims to become the MNIST of music audio processing.
创建时间:
2018-01-21
原始信息汇总
数据集概述
数据集名称
- 名称: minst-dataset
- 描述: 该数据集旨在整合多种不同的独奏乐器声音集合,形成一个标准化的大型数据集,便于机器学习应用。
数据集内容
-
数据来源:
- University of Iowa - MIS
- Philharmonia
- RWC - Instruments
- Good-Sounds
-
数据结构:
-
数据目录结构如下:
{DATA_DIR}/ uiowa/ ... RWC Instruments/ ... philharmonia/ ...
-
-
数据下载:
- 使用命令
make download或python scripts/download.py下载数据。
- 使用命令
数据处理
- 数据构建:
- 使用命令
make build从下载的文件中构建索引并提取音符音频。 - 生成文件包括:
- uiowa_notes.csv
- phil_notes.csv
- rwc_notes.csv
- goodsounds_notes.csv
- 使用命令
- 数据集生成:
- 使用命令
make dataset生成最终的数据集文件,包括:- master_index.csv
- rwc_partitions.csv
- uiowa_partitions.csv
- philharmonia_partitions.csv
- 使用命令
数据集统计
- 乐器与音符数量:
Instrument UIowa Philharmonia RWC Good-Sounds totals 3417 7923 27557 12015 bassoon 122 648 1405 cello 681 776 3196 2118 clarinet 258 770 1433 3359 double-bass 587 781 3465 flute 227 781 1095 2308 guitar 352 71 5618 horn-french 96 546 1896 oboe 104 539 770 494 trombone 66 769 2738 trumpet 212 433 1965 1883 tuba 111 838 540 violin 601 971 3436 1853
数据集使用
- 安装依赖:
- 使用命令
pip install git+git://github.com/ejhumphrey/minst-dataset.git和pip install -U -r requirements.txt安装依赖。
- 使用命令
- 测试安装:
- 使用命令
make test测试安装。
- 使用命令
- 数据集加载:
- 使用 Python/pandas 加载数据集,示例代码如下: python master_df = pd.read_csv(master_index.csv, index_col=0) partition_df = pd.read_csv(rwc_partitions.csv) train_df = master_df.loc[(partition_df[partition] == train).index]
数据集构建
- 构建流程:
- 下载数据 -> 构建索引 -> 提取音符音频 -> 生成数据集文件。
- 注意事项:
- 构建过程中可能需要调整
DATA_DIR以适应不同的数据存储位置。
- 构建过程中可能需要调整
数据集注释
- 音符起始点注释:
- 使用命令
python scripts/annotate.py进行音符起始点的注释。 - 注释工具支持多种操作,如添加/删除标记、移动标记等。
- 使用命令
搜集汇总
数据集介绍

构建方式
minst-dataset的构建过程整合了多个独立的乐器音频数据集,旨在为机器学习提供一个统一且标准化的音乐音频处理平台。通过从University of Iowa、Philharmonia、RWC Instruments和Good Sounds等来源收集数据,该数据集采用自动化脚本和手动校正相结合的方式,确保音频数据的质量和一致性。具体步骤包括数据下载、音频片段提取、注释生成及数据集索引的构建,最终生成包含音频文件路径和元数据的CSV文件。
使用方法
使用minst-dataset时,用户需先通过`make download`命令下载数据,随后使用`make build`命令提取音频片段并生成注释文件。最终,通过`make dataset`命令生成主数据集和分区文件。用户可通过Python和Pandas加载CSV文件,并根据分区信息划分训练集、验证集和测试集。此外,数据集还提供了GUI工具,支持用户手动校正音频起始点,进一步提升数据质量。
背景与挑战
背景概述
minst-dataset是由ejhumphrey等人于2017年创建的一个音乐音频处理数据集,旨在整合多个独立的独奏乐器音频集合,形成一个统一且标准化的数据集,便于机器学习研究。该数据集的设计灵感来源于经典的MNIST数据集,目标是为音乐音频处理领域提供一个基准数据集。minst-dataset包含了来自University of Iowa、Philharmonia、RWC Instruments和Good Sounds等多个来源的乐器音频数据,涵盖了多种乐器类型,如小提琴、大提琴、长笛等。该数据集的创建为音乐信息检索、乐器分类和音频特征提取等研究提供了重要的数据支持。
当前挑战
minst-dataset在构建和应用过程中面临多重挑战。首先,数据集的核心目标是解决音乐音频处理中的乐器分类问题,但由于乐器音频的多样性和复杂性,如何有效提取和区分不同乐器的音频特征仍是一个技术难题。其次,在数据集的构建过程中,研究人员需要整合来自不同来源的音频数据,这些数据在格式、采样率和标注方式上存在显著差异,导致数据标准化和预处理工作异常复杂。此外,现代音频分割算法在处理多音符音频文件时表现不佳,研究人员不得不采用人工干预的方式来优化音符起始点的标注,进一步增加了数据集的构建难度。这些挑战不仅影响了数据集的构建效率,也对后续的机器学习模型训练和评估提出了更高的要求。
常用场景
经典使用场景
minst-dataset作为音乐音频处理领域的基准数据集,广泛应用于机器学习模型的训练与评估。其经典使用场景包括音乐乐器声音的分类、乐器识别以及音频特征提取等任务。通过整合多个独立的乐器声音数据集,minst-dataset为研究者提供了一个标准化、易于使用的平台,极大地简化了音乐音频数据的预处理和实验设计。
解决学术问题
minst-dataset解决了音乐音频处理领域中数据分散、格式不统一的问题,为研究者提供了一个统一的基准数据集。通过整合来自不同来源的乐器声音数据,该数据集使得研究者能够更专注于算法和模型的开发,而不必花费大量时间在数据收集和预处理上。此外,minst-dataset还为音乐信息检索、音频分类等研究提供了丰富的数据支持,推动了相关领域的学术进展。
实际应用
minst-dataset在实际应用中具有广泛的潜力,尤其是在音乐教育、自动音乐转录和智能音乐推荐系统中。通过利用该数据集训练的模型,可以实现对乐器声音的自动识别和分类,从而辅助音乐教学和乐器学习。此外,该数据集还可用于开发智能音乐推荐系统,通过分析用户的音乐偏好,提供个性化的音乐推荐服务。
数据集最近研究
最新研究方向
在音乐信息检索领域,minst-dataset作为音乐音频处理的基准数据集,近年来吸引了广泛的研究兴趣。该数据集整合了多个独奏乐器音频资源,为机器学习模型提供了标准化的训练和测试环境。当前的研究方向主要集中在利用深度学习技术进行乐器声音的分类与识别,以及音乐特征提取的自动化。此外,随着生成对抗网络(GANs)和变分自编码器(VAEs)等技术的进步,研究者们开始探索如何利用这些模型生成高质量的音乐音频,从而推动音乐创作和音频合成的创新。minst-dataset的广泛应用不仅加速了音乐信息检索技术的发展,也为跨学科研究提供了宝贵的数据支持。
以上内容由遇见数据集搜集并总结生成



