Lo-Fi Drums Dataset
收藏github2025-05-24 更新2025-06-10 收录
下载链接:
https://github.com/patchbanks/Lo-Fi-Drums-Dataset
下载链接
链接失效反馈官方服务:
资源简介:
Lo-Fi Drums Dataset是一个开放的音频数据集,包含10,000个鼓循环,风格为lo-fi嘻哈音乐。数据集以未压缩的立体声WAV格式提供,并配有JSON文件,包含用于监督生成AI音频模型的标签数据。
The Lo-Fi Drums Dataset is an open audio dataset encompassing 10,000 drum loops in the style of lo-fi hip-hop music. The dataset is provided in uncompressed stereo WAV format and is accompanied by a JSON file containing labeled data for supervising the generation of AI audio models.
创建时间:
2025-05-24
原始信息汇总
Lo-Fi Drums Dataset 数据集概述
数据集简介
Lo-Fi Drums Dataset 是一个开放音频数据集,包含以低保真嘻哈音乐风格录制的鼓声样本。数据集提供10,000个未压缩的立体声WAV格式音频循环,以及配对的JSON标签文件,用于生成式AI音频模型的监督训练。
数据集详情
- 数据量:10,000个4小节音频循环(约37.5小时)
- 格式:16-bit 44.1kHz WAV
- 速度范围:50-90 BPM
- 标签数据:每个WAV文件配有JSON标签文件
- 鼓点模式:变奏鼓点模式
- 子流派风格:包括boom bap、chill hop、trip hop、hip hop
数据生成方法
- 使用算法框架从定制的MIDI模式和单次鼓样本数据库中随机生成音频循环
- 数据增强包括随机样本交换和混响建模,以生成独特的鼓组、音效和声学空间
主要用途
- 文本到音频生成
- 提示工程
- 特征提取
- 速度检测
- 音频分类
- 节奏分析
- 音乐信息检索(MIR)
- 声音设计和信号处理
文件命名参考
| 标签 | 说明 |
|---|---|
| bpm | 音频文件的速度 |
| lofi_drums_dataset | 数据集名称 |
| id | 识别编号 |
| 000000 | 播放列表轨道号 |
下载信息
- WAV文件下载(12.9 GB):https://zenodo.org/records/15493892/files/lofi_drums_dataset_wav.tar.gz?download=1
- JSON文件下载(419.8 kB):https://zenodo.org/records/15493892/files/lofi_drums_dataset_json.tar.gz?download=1
许可证
- 采用Creative Commons Attribution 4.0 International (CC BY 4.0)许可证
- 许可证链接:https://creativecommons.org/licenses/by/4.0/
引用信息
bash @dataset{Lo-Fi Drums Dataset, author = {WaivOps}, title = {WaivOps Lo-Fi Drums Dataset: Open Audio Resources for Machine Learning in Music}, year = {2025}, doi = {10.5281/zenodo.15493892}, url = {https://doi.org/10.5281/zenodo.15493892}, }
联系方式
- 邮箱:info@patchbanks.com
搜集汇总
数据集介绍

构建方式
在音乐信息检索领域,Lo-Fi Drums Dataset通过算法框架系统化构建,基于定制化的MIDI节奏模式和单次鼓采样数据库随机生成音频循环。采用样本随机替换和混响建模等数据增强技术,为每个鼓组塑造独特的声学特性与音效空间。所有素材均经过版权验证,最终形成包含1万条无损WAV音频及对应JSON标签的标准化配对数据。
使用方法
研究者可通过Zenodo平台获取12.9GB的WAV文件包和419.8kB的JSON元数据,解压后即获得编号对应的音频-标签配对文件。数据集适用于文本到音频转换、节奏特征提取等音乐信息检索任务,关键映射文件支持自定义标签修改。使用时应遵循CC BY 4.0协议,并在学术成果中引用指定的DOI标识符。
背景与挑战
背景概述
Lo-Fi Drums Dataset是由WaivOps团队开发并于2025年发布的开放式音频数据集,专注于低保真嘻哈音乐风格的鼓声录音。该数据集包含10,000个未压缩的立体声WAV格式音频循环片段,并配有相应的JSON标签文件,旨在为生成式AI音频模型的监督训练提供支持。数据集通过算法框架从定制的MIDI模式和单次鼓样本数据库中随机生成音频循环,并应用数据增强技术如随机样本交换和混响建模,以创造独特的鼓组、音效和声学空间。其核心研究问题在于如何为音乐领域的机器学习应用提供高质量、多样化的训练数据,推动文本到音频生成、音乐信息检索等方向的发展。
当前挑战
Lo-Fi Drums Dataset面临的挑战主要体现在两个方面:领域问题方面,低保真音乐风格的鼓声具有独特的音色和节奏特征,如何准确捕捉并生成这些特征以保持音乐风格的完整性是一大挑战;构建过程方面,数据集需要平衡音频质量与多样性,确保生成的鼓声既符合低保真美学又具备足够的变异性以供模型学习。此外,版权清理和数据标注的准确性也是构建过程中的关键挑战,需要确保所有录音来源合法且标签数据精确无误。
常用场景
经典使用场景
在音乐信息检索和生成式人工智能领域,Lo-Fi Drums Dataset以其精心设计的鼓循环音频和配对标签数据,成为训练和微调AI模型的理想选择。该数据集特别适用于研究音乐生成、节奏分析和音频分类等任务,为学术界和工业界提供了高质量的基准数据。其丰富的子流派风格和多样的节奏变化,使得研究者能够深入探索不同音乐风格的特征表达和生成模式。
解决学术问题
Lo-Fi Drums Dataset有效解决了音乐生成和音频分析领域中的多个关键问题。通过提供大量标注清晰的鼓循环数据,该数据集为监督学习任务如文本到音频生成、节奏检测和音乐信息检索提供了可靠的基础。其多样化的节奏模式和子流派风格,使得研究者能够系统性地探究音乐特征与生成模型性能之间的关系,推动了音乐AI领域的算法创新和理论发展。
实际应用
在实际应用层面,Lo-Fi Drums Dataset为音乐制作和声音设计提供了丰富的素材库。音乐制作人可利用该数据集快速生成符合特定风格的鼓节奏,大幅提升创作效率。在游戏音效和影视配乐领域,这些精心设计的鼓循环能够为作品增添独特的音乐质感。同时,该数据集也为音乐教育提供了实用的教学资源,帮助学生理解不同音乐风格的节奏特征。
数据集最近研究
最新研究方向
在音乐信息检索与生成式人工智能交叉领域,Lo-Fi Drums Dataset正推动着多项前沿探索。该数据集以其精心标注的鼓点循环样本,成为训练文本到音频生成模型的关键资源,特别是在低传真嘻哈风格的音乐生成任务中展现出独特价值。研究者们正利用其丰富的节奏变体和子流派标注,开发能够理解复杂音乐语义的神经网络架构,实现从自然语言描述到个性化鼓点生成的端到端学习。与此同时,该数据集也被应用于音乐结构分析与节奏模式挖掘,为智能音乐制作系统提供底层支持。其开放共享特性加速了音乐人工智能社区在跨模态表示学习、实时音频合成等方向的技术迭代。
以上内容由遇见数据集搜集并总结生成



