GiantSteps (tempo+genre)
收藏github2023-09-08 更新2024-05-31 收录
下载链接:
https://github.com/GiantSteps/giantsteps-tempo-dataset
下载链接
链接失效反馈官方服务:
资源简介:
这是一个包含664个2分钟音频预览的注释集合,这些音频来自www.beatport.com,主要用于电子舞曲的节奏估计和键检测。数据集通过用户修正进行注释,包括节奏(BPM)和流派信息。
This is an annotated collection comprising 664 two-minute audio previews sourced from www.beatport.com, primarily utilized for tempo estimation and key detection in electronic dance music. The dataset has been annotated through user corrections, including tempo (BPM) and genre information.
创建时间:
2015-09-16
原始信息汇总
数据集概述
数据集名称
- GiantSteps (tempo+genre)
数据集描述
- 包含664个2分钟音频预览的注释集合,来源于www.beatport.com。
数据集内容
- 音频文件:原始音频文件,格式为mp3。
- MD5哈希:原始音频文件的MD5哈希值。
- 注释:
- tempo (bpm):速度注释。
- genre:类型注释。
- GiantSteps项目格式:特定格式的注释。
- JAMS格式:https://github.com/marl/jams定义的格式。
- MIREX-style:(T1 T2 ST1)风格的注释。
数据集注释细节
- 速度注释来自用户对bpm值的修正(手动注释)。
- 类型信息通过解析网站中的JSON获取。
数据集特殊说明
- 部分文件无速度注释,其速度值标记为0.0。
- 大多数音频文件长度为120秒,但有少数例外,具体如下:
- 906760.LOFI.mp3:62秒
- 1327052.LOFI.mp3:70秒
- 4416506.LOFI.mp3:80秒
- 1855660.LOFI.mp3:119秒
- 3419452.LOFI.mp3:119秒
- 3577631.LOFI.mp3:119秒
搜集汇总
数据集介绍

构建方式
GiantSteps (tempo+genre) 数据集的构建基于从Beatport网站获取的664个音频预览片段,每个片段时长约为2分钟。音频文件以MP3格式存储,并通过MD5哈希值确保文件完整性。数据集的注释部分包括节奏(BPM)和音乐风格(genre),其中节奏信息通过用户论坛中的手动修正获取,而风格信息则通过解析网站内的JSON数据提取。此外,数据集还提供了多种注释格式,包括JAMS和MIREX格式,以适应不同的研究需求。
使用方法
使用GiantSteps (tempo+genre) 数据集时,用户可以通过提供的bash脚本自动下载音频文件,或手动从指定链接获取。下载后,用户可以使用sox工具将MP3文件转换为WAV格式,以便进一步处理。数据集的注释文件存储在多个目录中,用户可根据需要选择JAMS、MIREX或其他格式的注释。此外,数据集还提供了文件分割定义,便于用户进行实验设计和模型训练。
背景与挑战
背景概述
GiantSteps (tempo+genre) 数据集由维也纳技术大学的Richard Vogl和Peter Knees等人于2015年创建,旨在为电子舞曲(EDM)的节奏估计和调性检测提供高质量的标注数据。该数据集包含664段来自Beatport网站的2分钟音频片段,涵盖了丰富的节奏(bpm)和流派(genre)信息。通过用户修正的论坛数据,研究者们手动标注了节奏信息,并解析了网站上的JSON数据以获取流派信息。该数据集在音乐信息检索(MIR)领域具有重要影响力,特别是在电子舞曲的节奏和流派分析方面,为相关算法的开发和评估提供了重要支持。
当前挑战
GiantSteps数据集在构建和应用过程中面临多重挑战。首先,节奏标注依赖于用户修正的论坛数据,这种手动标注方式虽然提高了数据的准确性,但也带来了标注不一致性和数据缺失的问题,部分音频文件甚至缺乏节奏标注。其次,数据集的音频文件长度存在不一致性,尽管大多数文件为120秒,但部分文件长度显著较短,这可能影响算法的训练和评估效果。此外,数据集的构建依赖于外部网站(Beatport)的音频文件,这些文件的可用性和稳定性可能随时间变化,增加了数据获取和维护的难度。这些挑战为研究者在数据预处理和算法设计上提出了更高的要求。
常用场景
经典使用场景
GiantSteps (tempo+genre)数据集在音乐信息检索领域中被广泛用于节奏(tempo)和流派(genre)的自动标注研究。该数据集包含了来自Beatport网站的664个2分钟音频片段,每个片段都附有详细的节奏和流派注释。这些数据为研究者提供了一个标准化的测试平台,用于开发和评估音乐节奏估计和流派分类算法。
解决学术问题
GiantSteps数据集解决了音乐信息检索领域中的两个核心问题:节奏估计和流派分类。通过提供大量经过人工校正的节奏数据和流派标签,该数据集使得研究者能够更准确地训练和验证算法,从而推动了音乐自动标注技术的发展。此外,该数据集还为研究社区提供了一个基准,促进了不同算法之间的公平比较。
实际应用
在实际应用中,GiantSteps数据集被广泛用于音乐推荐系统和音乐分析工具的开发。例如,音乐流媒体平台可以利用该数据集中的节奏和流派信息,为用户提供个性化的播放列表推荐。此外,音乐制作人和DJ也可以利用这些数据来优化他们的创作和混音过程,确保音乐的节奏和风格符合目标受众的偏好。
数据集最近研究
最新研究方向
在音乐信息检索领域,GiantSteps (tempo+genre) 数据集为电子舞曲的节奏估计和风格分类提供了重要的研究基础。近年来,随着深度学习技术的快速发展,研究者们开始探索如何利用该数据集中的节奏和风格标注信息,结合先进的神经网络模型,提升音乐节奏估计的精度和风格分类的准确性。特别是在多模态数据融合方面,研究者尝试将音频特征与用户生成的元数据相结合,以捕捉更丰富的音乐语义信息。此外,该数据集还被广泛应用于音乐推荐系统的开发中,通过分析用户的节奏偏好和风格倾向,优化个性化推荐算法。这些研究不仅推动了音乐信息检索技术的进步,也为音乐产业的实际应用提供了有力支持。
以上内容由遇见数据集搜集并总结生成



