GiantSteps (key)
收藏github2023-11-10 更新2024-05-31 收录
下载链接:
https://github.com/GiantSteps/giantsteps-key-dataset
下载链接
链接失效反馈官方服务:
资源简介:
包含604个2分钟音频预览的注释集合,来自www.beatport.com,用于电子舞曲的节奏估计和键检测。
A collection of annotations for 604 two-minute audio previews sourced from www.beatport.com, intended for tempo estimation and key detection in electronic dance music.
创建时间:
2015-09-17
原始信息汇总
数据集概述
数据集名称
- 名称: GiantSteps (key)
数据集描述
- 描述: 包含604个2分钟音频预览的注释集合,来自www.beatport.com。
数据集内容
- 音频文件: 原始音频文件,格式为mp3。
- MD5哈希: 原始音频文件的MD5哈希值。
- 注释:
- 流派: 流派注释。
- 键: 键注释。
- GiantSteps项目格式: 注释。
- JAMS格式: 注释。
数据集注释
- 注释类型: 键
数据集文件下载与转换
- 音频下载: 可通过bash脚本
./audio_dl.sh或手动链接下载。 - 音频转换: 使用bash和sox工具将音频文件转换为.wav格式。
数据集例外情况
- 音频长度例外: 部分音频文件长度非120秒,具体如下:
- 1224698.LOFI.mp3: 45秒
- 1442809.LOFI.mp3: 62秒
- 3424038.LOFI.mp3: 77秒
- 4452003.LOFI.mp3: 59秒
搜集汇总
数据集介绍

构建方式
GiantSteps (key)数据集的构建基于604首来自beatport.com的电子舞曲音频片段,每段音频时长约为2分钟。音频文件以MP3格式提供,并通过MD5哈希值确保数据完整性。数据集的标注信息包括音乐流派和调性(key),其中调性标注来源于用户论坛中的手动修正。此外,数据集还提供了GiantSteps项目格式和JAMS格式的标注文件,便于不同研究需求的使用。
特点
GiantSteps (key)数据集以其高质量的调性标注和多样化的电子舞曲音频片段著称。数据集涵盖了丰富的音乐流派,调性标注通过用户手动修正确保了较高的准确性。音频文件以MP3格式提供,并可通过脚本转换为WAV格式,便于进一步分析。数据集还提供了多种格式的标注文件,支持灵活的研究应用。
使用方法
使用GiantSteps (key)数据集时,用户可通过提供的bash脚本自动下载音频文件,或手动从指定链接获取。音频文件可通过脚本转换为WAV格式,便于后续处理。调性和流派标注信息分别存储于不同目录中,用户可根据需求选择GiantSteps或JAMS格式的标注文件。数据集的使用需遵循其引用规范,并可通过联系作者获取更多详细信息。
背景与挑战
背景概述
GiantSteps (key) 数据集由Peter Knees、Ángel Faraldo等研究人员于2015年创建,旨在为电子舞曲(EDM)的节奏估计和调性检测提供高质量的标注数据。该数据集包含604段来自Beatport网站的2分钟音频片段,并通过用户修正的方式获取了调性标注。该数据集在音乐信息检索领域具有重要影响力,特别是在电子舞曲的分析和研究中,为算法开发和模型训练提供了宝贵的资源。其研究成果发表于第16届国际音乐信息检索会议(ISMIR'15),进一步推动了音乐信息检索技术的发展。
当前挑战
GiantSteps (key) 数据集在构建过程中面临多重挑战。首先,调性标注依赖于用户修正,这可能导致标注的主观性和不一致性,影响数据的可靠性。其次,音频文件的长度不完全一致,部分文件短于标准时长,增加了数据处理的复杂性。此外,数据集的构建依赖于Beatport网站的音频资源,其可用性和稳定性可能随时间变化,影响数据的长期可访问性。在应用层面,该数据集主要用于电子舞曲的调性检测和节奏估计,这些任务本身具有较高的技术难度,特别是在处理复杂节奏和多变的调性时,算法的准确性和鲁棒性仍需进一步提升。
常用场景
经典使用场景
GiantSteps (key)数据集在音乐信息检索领域中被广泛用于电子舞曲(EDM)的调性检测研究。研究者利用该数据集中的音频文件和调性标注,开发并验证了多种调性检测算法。这些算法能够自动识别音乐片段的调性,为音乐分类、推荐系统和音乐分析提供了基础支持。
实际应用
在实际应用中,GiantSteps (key)数据集被广泛用于音乐流媒体平台的推荐系统。通过准确识别音乐的调性,平台能够为用户提供更加个性化的音乐推荐,提升用户体验。此外,该数据集还被用于音乐教育工具的开发,帮助学习者理解和分析音乐的调性结构。
衍生相关工作
基于GiantSteps (key)数据集,研究者们开发了多种调性检测算法和模型。例如,一些工作利用深度学习技术,结合该数据集的标注信息,显著提升了调性检测的准确性和鲁棒性。此外,该数据集还促进了音乐信息检索领域的标准化工作,推动了JAMS格式的广泛应用。
以上内容由遇见数据集搜集并总结生成



