EDM-HSE
收藏github2024-09-17 更新2024-09-21 收录
下载链接:
https://github.com/patchbanks/WaivOps-EDM-HSE
下载链接
链接失效反馈官方服务:
资源简介:
EDM-HSE是一个开源音频数据集,包含8000个现代电子house音乐风格的代码生成鼓录音。数据集包括8000个未压缩的立体声WAV格式的音频循环,使用自定义音频样本和MIDI鼓数据集创建。数据集还附带了包含MIDI音符编号(音高)和节奏数据的JSON文件,适用于生成AI音频模型的监督训练。
EDM-HSE is an open-source audio dataset containing 8000 code-generated drum recordings in the modern electronic house music style. The dataset includes 8000 uncompressed stereo WAV-format audio loops, which were created using custom audio samples and MIDI drum datasets. It also comes with accompanying JSON files that contain MIDI note numbers (pitch) and rhythm data, suitable for supervised training of generative AI audio models.
创建时间:
2024-09-17
原始信息汇总
EDM-HSE Dataset
概述
EDM-HSE是一个开放的音频数据集,包含8,000个以现代电子浩室音乐风格生成的鼓录音。这些录音以无压缩的立体声WAV格式记录,使用自定义音频样本和MIDI鼓数据集创建。数据集还包括配对的JSON文件,包含MIDI音符编号(音高)和节奏数据,适用于生成式AI音频模型的监督训练。
特点
- 音频文件: 8,000个音频循环(约17小时)
- 格式: 24-bit WAV
- 节奏范围: 120–130 BPM
- 配对数据: WAV + JSON
- 鼓模式: 变分鼓模式
- 子风格: Big room, electro, minimal, classic
用途
该数据集主要用于音乐和音频的机器学习应用,包括生成音乐、特征提取、节奏检测、音频分类、节奏分析、鼓合成、音乐信息检索(MIR)、声音设计和信号处理。
下载
- 音频文件: 24-bit WAV格式,编码为44.1kHz,总大小7.6GB。
- JSON文件: 总大小245KB。
许可证
该数据集采用Creative Commons Attribution 4.0 International (CC BY 4.0) 许可证。
引用
bash @misc{EDM-HSE, author = {WaivOps}, title = {WaivOps EDM-HSE: Open Audio Resources for Machine Learning in Music}, year = {2024}, doi = {10.5281/zenodo.13769544}, url = {https://doi.org/10.5281/zenodo.13769544}, }
注意事项
该数据集尚未完全审查,可能包含轻微的记谱错误或音频缺陷。
搜集汇总
数据集介绍

构建方式
在电子音乐(EDM)领域,EDM-HSE数据集通过算法框架生成了一系列现代电子舞曲风格的鼓录音。该数据集包含8,000个无压缩的立体声WAV格式音频循环,这些音频循环由自定义音频样本和MIDI鼓数据集生成。为了实现监督训练,采用了变分混合技术对渲染的音频文件进行处理,系统性地包含或排除鼓音符,以帮助模型识别鼓乐器之间的模式和关系,从而增强其泛化能力。
特点
EDM-HSE数据集的显著特点在于其丰富的音频内容和多样化的鼓模式。该数据集不仅提供了8,000个音频循环,还附带了包含MIDI音符编号和节奏数据的JSON文件,这些文件为生成式AI音频模型的训练提供了有力的支持。此外,数据集涵盖了多种子风格,如Big room、electro、minimal和classic,使其在音乐信息检索和声音设计等领域具有广泛的应用潜力。
使用方法
使用EDM-HSE数据集时,用户可以下载包含音频文件和JSON标签的压缩包。音频文件以24-bit WAV格式提供,采样率为44.1kHz,适合用于机器学习模型的训练和测试。JSON文件则提供了MIDI音符编号和节奏数据,用户可以根据需要更新文本标签。数据集适用于生成音乐、特征提取、节奏分析等多种应用场景,为音乐和音频领域的研究提供了宝贵的资源。
背景与挑战
背景概述
EDM-HSE数据集是由WaivOps团队开发的一个开放音频数据集,专注于现代电子舞曲(EDM)风格的鼓录音。该数据集包含8,000个无压缩的立体声WAV格式音频循环,通过自定义音频样本和MIDI鼓数据集生成。其创建目的是为机器学习在音乐和音频领域的应用提供丰富的训练资源。数据集不仅包含音频文件,还配备了相应的JSON文件,记录了MIDI音符编号和节奏数据,旨在支持生成式AI音频模型的监督训练。通过算法框架生成可能的鼓乐谱,并应用变分混合技术,该数据集在识别鼓乐器之间的模式和关系方面具有显著优势,从而增强了模型的泛化能力。
当前挑战
尽管EDM-HSE数据集在电子舞曲领域提供了丰富的资源,但其构建过程中仍面临若干挑战。首先,生成符合现代EDM风格的鼓录音需要精确的算法和高质量的音频样本,这要求开发团队具备深厚的音频处理技术。其次,数据集的标注工作复杂,需要确保MIDI音符编号和节奏数据的准确性,以支持有效的监督训练。此外,数据集的版权问题也是一个重要挑战,确保所有录音的版权清晰是数据集合法使用的前提。最后,数据集的规模和多样性要求高效的存储和传输解决方案,以满足用户对大规模数据集的需求。
常用场景
经典使用场景
在现代电子音乐领域,EDM-HSE数据集以其丰富的音频循环和精确的MIDI数据,成为生成音乐模型的理想训练资源。该数据集的经典使用场景包括生成音乐、特征提取、节奏分析和鼓合成。通过利用其8,000个音频循环和配对的JSON文件,研究人员和开发者能够训练出能够识别和生成电子音乐中常见鼓模式的AI模型,从而推动音乐创作的自动化和个性化。
解决学术问题
EDM-HSE数据集在学术研究中解决了多个关键问题,特别是在音乐信息检索(MIR)和音频分类领域。它通过提供高质量的音频和MIDI数据,帮助研究者开发更精确的节奏检测和音频分类算法。此外,该数据集的变分鼓模式设计,增强了模型对不同音乐风格的泛化能力,为音乐生成和分析提供了新的研究方向。
衍生相关工作
基于EDM-HSE数据集,已衍生出多项经典工作,包括基于深度学习的音乐生成模型和节奏分析工具。例如,一些研究团队利用该数据集开发了能够自动生成电子音乐片段的AI系统,这些系统在音乐创作和娱乐产业中展现出巨大潜力。此外,该数据集还促进了音乐信息检索和音频分类技术的进步,为相关领域的研究提供了坚实的基础。
以上内容由遇见数据集搜集并总结生成



