five

disco-eth/edm-cue

收藏
Hugging Face2024-07-15 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/disco-eth/edm-cue
下载链接
链接失效反馈
官方服务:
资源简介:
EDM-CUE数据集包含约5k首电子舞曲(EDM)曲目的元数据,特别是21k个由人类专家手动放置的cue点。cue点对于DJ来说至关重要,因此该数据集旨在探讨是否可以通过学习系统自动放置cue点。数据集的特征包括曲目ID、标题、艺术家、时长、流派、调性、节拍网格和cue点位置。节拍网格包含四个值:起始位置、初始节拍、每分钟节拍数和时间签名。cue点位置以秒为单位表示。

The EDM-CUE dataset contains metadata for ~5k EDM tracks, specifically 21k cue points manually placed by human experts. Cue points are essential for DJs, and the dataset aims to explore whether they can be placed by a learned system. The dataset features include track ID, title, artists, duration, genre, key, beat grid, and cue point positions. The beat grid contains four values: start position, initial beat, beats per minute, and time signature. Cue point positions are represented in seconds.
提供机构:
disco-eth
原始信息汇总

EDM-CUE 数据集概述

数据集信息

  • 名称: EDM-CUE
  • 许可证: MIT
  • 大小类别: 1K < n < 10K
  • 下载大小: 292711 bytes
  • 数据集大小: 706945 bytes

数据集结构

特征

  • id: 轨道在Deezer上的ID,数据类型为int64。
  • title: 轨道名称,数据类型为string。
  • artists: 轨道艺术家,数据类型为string。
  • duration: 轨道时长(秒),数据类型为int64。
  • genre: 流派列表(可能不完整),数据类型为string序列。
  • key: 由rekordbox生成的轨道键(可能不正确),数据类型为string序列。
  • beat_grid: 包含4个值以计算网格的结构:
    • bpm: 每分钟节拍数,数据类型为float64。
    • init_beat: 起始位置的节拍数,数据类型为int64。
    • start_pos: 起始位置(秒),数据类型为float64。
    • time_sig: 时间签名,数据类型为string。
  • cue_pts: 提示点的位置(秒),数据类型为float64序列。

数据分割

  • train: 包含4609个样本,大小为690103 bytes。
  • valid: 包含101个样本,大小为16842 bytes。

配置

  • config_name: default
    • data_files:
      • train: 路径为data/train-*
      • valid: 路径为data/valid-*

标签

  • music
搜集汇总
数据集介绍
main_image_url
构建方式
EDM-CUE数据集专为电子舞曲(EDM)的音频处理研究而构建,旨在探索能否通过机器学习系统自动放置DJ常用的提示点(cue points)。该数据集从Deezer平台精选了约5000首EDM曲目,并收集了由人类专家手动标注的21000个提示点位置。每个样本包含曲目ID、标题、艺术家、时长(秒)、流派列表、调性(由rekordbox生成)、节拍网格(含BPM、起始节拍、起始位置及拍号)以及提示点的时间位置(秒)。数据划分为训练集(4609例)和验证集(101例),以支持模型的训练与评估。
特点
该数据集的核心特点在于其聚焦于DJ领域的提示点估计任务,提供了高质量的人类专家标注,确保了提示点位置的专业性与可靠性。其结构丰富,融合了曲目元数据与节拍网格信息,为研究音频时间结构分析提供了多维特征。数据集规模适中(约5k曲目),既保证了数据的多样性,又避免了过大的计算负担,适合作为提示点检测任务的基准。此外,数据采用MIT许可证发布,促进了学术与工业界的开放研究。
使用方法
使用该数据集极为便捷,用户可通过HuggingFace的datasets库直接加载,执行`load_dataset("disco-eth/edm-cue")`即可获取训练与验证集。数据以默认配置提供,包含结构化的特征列,便于直接用于模型训练或特征分析。研究人员可基于cue_pts字段进行提示点回归或分类任务,结合beat_grid信息探索节拍与提示点之间的关联。推荐参考相关论文《Cue Point Estimation using Object Detection》以获取更详尽的方法论与基线结果。
背景与挑战
背景概述
电子舞曲(EDM)作为现代音乐产业的重要分支,其现场表演中DJ对曲目节奏与结构的精准掌控至关重要。cue点作为衔接不同曲目的关键标记,传统上依赖人工标注,效率低下且主观性强。为探索自动化cue点检测的可能性,苏黎世联邦理工学院(ETH Zurich)的研究团队于2024年推出了EDM-CUE数据集。该数据集收录了约5000首EDM曲目的元数据,包含21,000个由专业DJ手工标注的cue点,覆盖了曲目时长、调性、节拍网格等多维度信息。作为首个公开的cue点标注基准,该数据集为音乐信息检索领域提供了标准化评估平台,并推动了基于目标检测的自动化cue点估计方法的发展。其研究论文发表于arXiv(2407.06823),已成为相关领域的重要参考。
当前挑战
EDM-CUE数据集面临的核心挑战在于cue点标注的主观性与音乐结构的复杂性。首先,不同DJ对同一曲目最佳cue点的选择存在显著差异,使得自动化系统难以建立统一的评价标准。其次,曲目时长、BPM(每分钟节拍数)和调性等特征的高度非线性关系,增加了模型对动态音乐结构理解的难度。在数据集构建过程中,研究者需应对标注一致性验证的挑战,确保21,000个手工标注点的可靠性。此外,数据规模相对有限(约5000首曲目),而EDM流派内部子风格差异显著(如House、Techno、Dubstep),可能导致模型在特定风格上的泛化能力不足。如何设计兼顾主观偏好与客观规律的算法,仍是该领域亟待突破的瓶颈。
常用场景
经典使用场景
在电子舞曲(EDM)研究领域,EDM-CUE数据集以其对DJ打碟核心要素——Cue点的精准标注而独树一帜。该数据集收录了约5000首EDM曲目的元数据,包含由人类专家手动标注的超过21000个Cue点位置信息。经典的使用场景是将Cue点估计任务转化为目标检测问题,利用曲目的节拍网格、调性、时长等结构化特征,训练模型自动预测Cue点的精确时间位置,从而在音乐信息检索(MIR)领域开辟了从音序特征到关键操作点映射的新范式。
解决学术问题
该数据集直面了电子音乐表演中自动Cue点标注这一长期被忽视的学术难题。传统研究多聚焦于节拍跟踪或音乐结构分割,但缺乏针对DJ实际操作中关键标记点(如混音入口、高潮衔接点)的标准化数据集。EDM-CUE通过提供高质量人工标注,首次将Cue点估计形式化为一个可量化的回归与分类问题,推动了音乐时序分析从宏观结构向微观操作粒度的深化。其意义在于弥合了音乐理论分析与表演实践之间的鸿沟,为智能DJ系统、自动混音算法等研究奠定了数据基础。
衍生相关工作
围绕EDM-CUE数据集,学术界已衍生出一系列具有启发性的工作。原始论文《Cue Point Estimation using Object Detection》开创性地将计算机视觉中的目标检测框架迁移至一维音乐信号,利用节拍网格作为锚点,通过回归网络预测Cue点偏移量。后续研究进一步探索了多模态融合方法,将频谱特征与结构化元数据结合以提升跨曲风流派的泛化能力。此外,该数据集也被用作评估音乐结构分割算法的新基准,对比其标注的Cue点与自动检测的段落边界之间的语义关联,催生了关于表演性音乐标注的深入讨论。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作