five

GiantSteps (tempo+genre)

收藏
github2015-11-05 更新2024-05-31 收录
下载链接:
https://github.com/EQ4/giantsteps-tempo-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
包含664个2分钟音频预览的注释集合,来自www.beatport.com,用于电子舞曲的节奏估计和键检测。

A collection of annotations for 664 two-minute audio previews sourced from www.beatport.com, intended for rhythm estimation and key detection in electronic dance music.
创建时间:
2015-11-05
原始信息汇总

数据集概述

数据集名称

  • 名称: GiantSteps (tempo+genre)

数据集描述

  • 描述: 包含664个2分钟音频预览的标注集合,来源于www.beatport.com。

数据集内容

  • 音频文件: 原始音频文件,格式为mp3。
  • MD5哈希: 原始音频文件的MD5哈希值。
  • 标注:
    • 流派: 流派标注。
    • 节奏: 节奏标注(bpm)。
    • GiantSteps格式: 标注文件,符合GiantSteps项目格式。
    • JAMS格式: 标注文件,符合JAMS格式(https://github.com/marl/jams)。
    • 分割定义: 文件分割定义。

数据集参考文献

  • 参考文献: Peter Knees, Ángel Faraldo, Perfecto Herrera, Richard Vogl, Sebastian Böck, Florian Hörschläger, Mickael Le Goff. "Two data sets for tempo estimation and key detection in electronic dance music annotated from user corrections," Proc. of the 16th Conference of the International Society for Music Information Retrieval (ISMIR15), Oct. 2015, Malaga, Spain.

数据集下载与转换

  • 下载: 音频文件可通过bash脚本./audio_dl.sh自动下载,或手动从指定链接下载。
  • 转换: 使用bash脚本./convert_audio.sh配合sox工具将音频文件转换为.wav格式。

数据集标注来源

  • 流派信息: 从网站的JSON数据中解析得到。
  • 节奏标注: 从论坛用户修正的bpm值中提取(即手动标注的节奏)。
搜集汇总
数据集介绍
main_image_url
构建方式
GiantSteps (tempo+genre)数据集的构建基于664个时长为2分钟的音频预览,这些音频来源于www.beatport.com网站。数据集的构建过程中,首先通过bash脚本来下载原始音频文件,然后利用sox工具将音频文件转换为.wav格式。针对音频文件的流派信息,开发团队通过解析网站中的JSON获取。而对于节奏(bpm)的标注,则是通过论坛中用户对bpm值的纠正(即手动标注节奏)来提取。
使用方法
用户可以通过数据集提供的bash脚本来下载音频文件,并使用sox工具进行格式转换。获取到的数据集包含了音频文件、文件的MD5哈希值、以及对应的流派和节奏标注文件。用户可根据文件分割定义自行组织训练或测试集,以适应不同的研究需求。对于标注信息的访问,用户可以选择GiantSteps项目格式或JAMS格式,这提供了使用的灵活性。
背景与挑战
背景概述
GiantSteps (tempo+genre)数据集,是由Richard Vogl与Peter Knees等研究人员于2015年创建,隶属于音乐信息检索领域。该数据集汇集了664个来自www.beatport.com的2分钟音频预览的注释,旨在为电子舞曲音乐中的节奏估计和音调检测提供标注。GiantSteps (tempo+genre)数据集在音乐信息检索研究中具有重要地位,其研究成果被广泛应用于音乐识别、推荐系统及音乐生成等领域。
当前挑战
该数据集在构建过程中,研究人员面临了诸多挑战。首先,音频文件的下载和格式转换工作繁琐,且需要确保音频质量不受影响。其次,在标注过程中,如何准确提取音乐作品的节奏和风格信息,是对研究人员专业知识与标注技术的考验。此外,数据集构建过程中,还需解决从论坛帖子中提取节奏信息的一致性和准确性问题,以及从网站JSON中解析风格信息的挑战。
常用场景
经典使用场景
在音乐信息检索领域,GiantSteps (tempo+genre)数据集以其详尽的音频预览标注而广受欢迎。该数据集常被用于旋律识别、风格分类以及节奏分析等任务,其中最为经典的使用场景便是对电子舞曲的节奏(bpm)与风格(genre)进行自动检测与分类。
解决学术问题
GiantSteps (tempo+genre)数据集的构建,解决了音乐信息检索中自动标注音频文件节奏与风格所面临的准确性问题。通过提供人工校正的节奏与风格标注,该数据集为算法训练提供了高质量的基准,极大地推动了相关研究的进展,对音乐理解与推荐系统等领域具有深远影响。
实际应用
在实际应用中,GiantSteps (tempo+genre)数据集的应用范围广泛,从在线音乐平台的音乐推荐到智能音响的播放列表生成,均能见到其身影。它通过提供准确的节奏与风格信息,增强了用户音乐体验的个性化与智能化。
数据集最近研究
最新研究方向
在音乐信息检索领域,GiantSteps (tempo+genre)数据集以其详尽的音频预览标注,为节拍估计和音乐风格检测提供了重要资源。近期研究集中于利用此数据集进一步优化算法,以实现更精准的电子舞曲节奏与风格识别。该数据集的深度挖掘,不仅推动了音频处理技术的发展,也为音乐推荐系统、音乐创作辅助工具等应用提供了重要支撑,对音乐产业及学术研究均产生了深远影响。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作