Mainstage EDM Benchmark
收藏arXiv2024-09-11 更新2024-09-12 收录
下载链接:
https://anonymous.4open.science/r/Mainstage-EDM-Benchmark/
下载链接
链接失效反馈官方服务:
资源简介:
Mainstage EDM Benchmark数据集由约翰斯·霍普金斯大学、东南大学、国防科技大学和MBZUAI共同创建,旨在解决主流舞蹈音乐子流派分类的问题。该数据集包含超过1000首来自国际知名唱片公司的曲目,涵盖8个子流派,并采用连续软标签方法以捕捉跨子流派的特征。数据集的创建过程包括音频片段的收集、标注和特征提取,确保了数据的高质量和多样性。该数据集主要应用于音乐推荐、DJ曲目编排和互动多媒体等领域,旨在提升音乐信息检索的准确性和效率。
Mainstage EDM Benchmark dataset was co-created by Johns Hopkins University, Southeast University, National University of Defense Technology, and MBZUAI, aiming to tackle the classification task of mainstream dance music subgenres. This dataset contains over 1,000 tracks sourced from internationally renowned record labels, covering 8 subgenres, and adopts the continuous soft label methodology to capture cross-subgenre features. The dataset creation process includes audio clip collection, annotation and feature extraction, ensuring high data quality and diversity. This dataset is mainly applied in fields such as music recommendation, DJ track arrangement and interactive multimedia, with the goal of improving the accuracy and efficiency of music information retrieval.
提供机构:
约翰斯·霍普金斯大学, 东南大学, 国防科技大学, MBZUAI
创建时间:
2024-09-11
搜集汇总
数据集介绍

构建方式
Mainstage EDM Benchmark数据集的构建主要通过收集国际知名唱片公司发行的1000余首曲目,并对这些曲目进行手动标注,分为8个子流派。数据集专注于捕捉当前主舞台现场演出中最新的子流派趋势。在构建过程中,采用了一种连续的软标注方法来处理跨越多个子流派的音乐曲目,以保持音乐固有的复杂性。
特点
Mainstage EDM Benchmark数据集的特点在于其细致的子流派分类和创新的软标注策略。它不仅覆盖了广泛的子流派,而且通过软标注提供了更细致和丰富的音乐特征描述,使得模型能够更好地理解和表征电子舞曲中的细微差异。此外,该数据集还包含了用于音乐可视化应用的原生音频特征,适用于多种音乐信息检索场景。
使用方法
使用Mainstage EDM Benchmark数据集时,用户可以将其应用于音乐推荐、DJ音乐集策划和交互式多媒体等领域。数据集提供了详细的标注信息和特征提取工具,用户可以根据自己的需求对数据集进行相应的处理和模型训练。为了高效利用该数据集,建议用户具备一定的深度学习背景知识,并熟悉音频处理和特征提取的相关技术。
背景与挑战
背景概述
Mainstage EDM Benchmark数据集,是一项针对电子舞曲音乐子类型分类的研究成果。该数据集由Johns Hopkins University、Southeast University、National University of Defense Technology以及MBZUAI等机构的研究人员共同创建,旨在解决现有数据集在子类型表示不足及类别间重叠等问题。数据集包含了超过1000首来自世界各地顶级DJ的现场音乐片段,覆盖了电子舞曲中的大多数子类型,并通过软标注方法,为每首曲目提供了详细的标签信息,以捕捉曲目在多个子类型间的特征。这一研究对音乐信息检索领域产生了重要影响,为音乐推荐、DJ音乐集策划以及互动多媒体等应用场景提供了有力支持。
当前挑战
该数据集在构建过程中遇到的挑战主要包括:1) 子类型分类的挑战,因为现有的通用模型在识别特定子类型时表现不佳;2) 数据集构建的挑战,例如如何有效标注和表示音乐中的类别重叠特征。具体而言,Mainstage EDM Benchmark数据集通过引入软标注技术,解决了传统0/1硬标签在表现音乐类别重叠上的不足。同时,在模型训练方面,该数据集采用了深度学习方法,但如何在保持音质特征的同时,有效融合不同类型的音频特征,是构建过程中的一大挑战。
常用场景
经典使用场景
Mainstage EDM Benchmark数据集的典型应用场景在于对电子舞曲的子流派进行精细分类。该数据集通过收集国际知名唱片公司的1000+轨音乐,涵盖了当前主流的现场演出曲目,并采用连续软标签方法,为每首曲目提供了跨越多个子流派的信息,从而能够捕捉到电子舞曲中细微的风格差异。这一特性使得数据集在音乐推荐系统、多媒体内容自动生成等领域具有重要的应用价值。
衍生相关工作
基于Mainstage EDM Benchmark数据集,已经衍生出了一系列相关工作。这些工作不仅包括对数据集本身的分析和改进,还涉及到了使用该数据集训练出的模型在音乐可视化、音乐生成等领域的应用,进一步扩展了该数据集的影响力和应用范围。
数据集最近研究
最新研究方向
Mainstage EDM Benchmark数据集针对电子舞曲音乐分类任务,扩充了子流派数量并采用软标注策略以捕捉多流派特性。研究前沿在于提出针对细粒度子流派分类的专门数据集和基线模型,超越了通用大规模语言模型在特定任务上的表现,为音乐推荐、DJ音乐集制作等应用场景提供了高效工具。
相关研究论文
- 1Benchmarking Sub-Genre Classification For Mainstage Dance Music约翰斯·霍普金斯大学, 东南大学, 国防科技大学, MBZUAI · 2024年
以上内容由遇见数据集搜集并总结生成



