five

WRLD-SMB

收藏
github2024-10-12 更新2024-10-16 收录
下载链接:
https://github.com/patchbanks/WaivOps-WRLD-SMB
下载链接
链接失效反馈
官方服务:
资源简介:
WRLD-SMB是一个开源音频数据集,包含一系列以巴西桑巴音乐风格录制的合成鼓录音。它包括1,100个无压缩立体声WAV格式的音频循环,以及用于生成AI音频模型监督训练的配对JSON文件。

WRLD-SMB is an open-source audio dataset that includes a collection of synthetic drum recordings made in the Brazilian samba music style. It contains 1,100 audio loops in uncompressed stereo WAV format, alongside paired JSON files intended for supervised training of AI audio models.
创建时间:
2024-10-12
原始信息汇总

WRLD-SMB Dataset

概述

WRLD-SMB是一个开放的音频数据集,包含1,100个合成鼓录音,风格为巴西桑巴音乐。数据集以无压缩的立体声WAV格式录制,并附有用于生成AI音频模型监督训练的JSON文件。

详细信息

  • 音频数量: 1,100个音频循环(约5.5小时)
  • 格式: 16-bit 44.1kHz WAV
  • 节奏范围: 90–120 BPM
  • 附加数据: 配对的标签数据(WAV + JSON)
  • 风格: 传统和现代桑巴、波萨诺瓦、融合风格
  • 技术: 使用多速度音频样本和配对的MIDI数据,采用遗漏技术生成变异鼓模式

用途

该数据集旨在训练或微调AI模型,以学习高性能鼓记谱法,目标是复制小型鼓乐队的现场声音。适用于生成音乐、特征提取、节奏检测、音频分类、节奏分析、鼓合成、音乐信息检索(MIR)、声音设计和信号处理等领域。

下载

许可证

该数据集基于Creative Commons Attribution 4.0 International (CC BY 4.0) 许可证。

引用

bash @misc{WRLD-SMB, author = {WaivOps}, title = {WaivOps WRLD-SMB: Open Audio Resources for Machine Learning in Music}, year = {2024}, doi = {10.5281/zenodo.13921290}, url = {https://doi.org/10.5281/zenodo.13921290}, }

搜集汇总
数据集介绍
main_image_url
构建方式
WRLD-SMB数据集通过多速度音频样本和配对的MIDI数据集构建,旨在训练生成式AI音频模型。该数据集采用了一种称为‘dropout’的技术,对渲染后的音频文件进行处理,以生成鼓轨的变异混合,从而促进带有标签音频数据的增强和监督训练。这种构建方式不仅确保了数据集的多样性,还为模型提供了丰富的训练材料,使其能够学习到高表现的鼓乐记谱法,从而模拟小型鼓乐队的现场声音。
特点
WRLD-SMB数据集的主要特点在于其丰富的音频内容和多样化的鼓乐模式。该数据集包含了1,100个音频循环,格式为16位44.1kHz的WAV文件,涵盖了90至120BPM的节奏范围。此外,每个音频文件都配有JSON标签数据,便于监督训练。数据集还涵盖了传统和现代桑巴、波萨诺瓦及融合等多种子流派风格,为音乐信息检索、声音设计和信号处理等应用提供了广泛的可能性。
使用方法
WRLD-SMB数据集适用于多种机器学习应用,包括生成音乐、特征提取、节奏检测、音频分类、节奏分析、鼓合成等。用户可以通过下载WAV和JSON文件,直接用于训练或微调AI模型。数据集的文件命名规则清晰,便于用户快速定位和使用特定音频文件。此外,数据集遵循Creative Commons Attribution 4.0国际许可协议,确保了其广泛的可访问性和使用自由。
背景与挑战
背景概述
WRLD-SMB数据集是由WaivOps开发的一个开放音频数据集,专注于巴西桑巴音乐风格的合成鼓录音。该数据集包含1,100个无压缩立体声WAV格式的音频循环,以及配套的JSON文件,旨在用于生成AI音频模型的监督训练。WRLD-SMB数据集的创建旨在通过多速度音频样本和配套的MIDI数据集,训练或微调AI模型,以学习高性能的鼓符号,目标是复制小型鼓乐队的现场声音。该数据集的发布为音乐和音频领域的机器学习应用提供了丰富的资源,涵盖了生成音乐、特征提取、节奏分析等多个潜在应用场景。
当前挑战
WRLD-SMB数据集在构建过程中面临多项挑战。首先,合成鼓录音的多样性和复杂性要求高精度的音频处理技术,以确保数据的质量和一致性。其次,为实现监督训练,数据集采用了变分鼓模式和音频文件的丢弃技术,这增加了数据增强和标签处理的复杂性。此外,确保所有录音的版权清晰也是一大挑战,这需要通过验证的来源进行版权清理。最后,数据集的广泛应用场景,如生成音乐和节奏分析,要求模型能够准确理解和再现复杂的音乐结构,这对模型的训练和评估提出了更高的要求。
常用场景
经典使用场景
在音乐生成与分析领域,WRLD-SMB数据集以其独特的巴西桑巴音乐风格的合成鼓录音而著称。该数据集包含1,100个无压缩的立体声WAV格式音频循环,以及与之配对的JSON文件,旨在为生成式AI音频模型的监督训练提供支持。通过这些数据,研究者可以训练或微调AI模型,以学习高表现的鼓符号,从而模拟小型鼓乐队的现场声音。此外,数据集中的变异鼓模式和多速度音频样本为音乐生成、特征提取和节奏分析等应用提供了丰富的资源。
衍生相关工作
WRLD-SMB数据集的发布催生了多项相关研究和工作,特别是在音乐生成和音频处理领域。例如,有研究者利用该数据集开发了新的鼓声合成算法,显著提升了合成鼓声的自然度和表现力。此外,数据集还被用于多个音乐信息检索(MIR)项目,推动了节奏检测和音频分类技术的发展。在音乐教育领域,基于该数据集的AI辅助教学工具也得到了广泛应用,帮助学生更好地理解和掌握鼓乐技巧。这些衍生工作不仅扩展了数据集的应用范围,也为相关领域的研究提供了新的思路和方法。
数据集最近研究
最新研究方向
在音乐信息检索(MIR)领域,WRLD-SMB数据集的最新研究方向主要集中在利用其丰富的音频和标签数据来训练和优化生成式AI模型。这些模型不仅能够精确地模拟巴西桑巴音乐的鼓声,还能通过变分技术生成多样化的鼓点模式,从而推动音乐生成和节奏分析的前沿研究。此外,该数据集的应用还扩展到音频分类、特征提取和音效设计等多个方面,为音乐创作和信号处理提供了新的可能性。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作