five

POP-ROK

收藏
github2024-11-06 更新2024-11-08 收录
下载链接:
https://github.com/patchbanks/WaivOps-POP-ROK
下载链接
链接失效反馈
官方服务:
资源简介:
POP-ROK是一个开源音频数据集,包含未经筛选的合成鼓录音,风格为流行摇滚音乐。它包括5,378个未压缩的立体声WAV格式的音频循环,以及用于生成AI音频模型监督训练的配对JSON文件。该数据集旨在为音乐和音频的机器学习应用提供可访问的内容,适用于生成音乐、特征提取、节奏分析等多种用途。

POP-ROK is an open-source audio dataset containing unfiltered synthetic drum recordings in the pop-rock music style. It consists of 5,378 uncompressed stereo WAV-format audio loops, as well as paired JSON files intended for supervised training of AI audio models. This dataset aims to provide accessible content for machine learning applications in music and audio, supporting various use cases such as music generation, feature extraction, and rhythm analysis.
创建时间:
2024-11-05
原始信息汇总

POP-ROK Dataset

概述

POP-ROK是一个开放的音频数据集,包含5,378个未经筛选的合成鼓录音,风格为流行摇滚音乐。所有录音以无压缩的立体声WAV格式保存,并附有用于生成AI音频模型监督训练的JSON文件。

数据集开发

该数据集通过将大约30套原声鼓与涵盖基本节奏模式的MIDI数据集配对,并排除toms,进行声音化处理。数据增强包括随机鼓交换方法和混响模拟,以生成独特的鼓组并代表各种房间大小。该数据集旨在用于训练或微调AI模型,以节奏记谱法与配对的鼓音符标签,旨在复制现场鼓声。

主要用途

该数据集的主要目的是为音乐和音频领域的机器学习应用提供可访问的内容。潜在用途包括生成音乐、特征提取、节奏检测、音频分类、节奏分析、鼓合成、音乐信息检索(MIR)、声音设计和信号处理。

规格

  • 5,378个音频循环(约24小时)
  • 16位44.1kHz WAV格式
  • 节奏范围:100-130 BPM
  • 配对标签数据(WAV + JSON)
  • 变异鼓模式
  • 子流派风格(流行、经典摇滚、软摇滚、乡村)

示例

查看示例文件夹以预览mp3演示。

许可证

该数据集由WaivOps开发,这是一个由声音标签公司Patchbanks管理的众包音乐项目。所有录音均由经过验证的来源编译,以确保版权清晰。

POP-ROK数据集根据Creative Commons Attribution 4.0 International (CC BY 4.0) 许可证发布。

下载

文件名参考

标签 参考
bpm 音频文件的节奏
pop 主要流派(流行)
rok 子流派(摇滚)
drm 乐器(鼓)
id 识别号
0000 播放列表曲目号

引用

如果您在研究或开发项目中使用此数据集,请引用以下参考文献: bash @dataset{POP-ROK, author = {WaivOps}, title = {WaivOps POP-ROK: Open Audio Resources for Machine Learning in Music}, year = {2024}, doi = {10.5281/zenodo.14038284}, url = {https://doi.org/10.5281/zenodo.14038284}, }

搜集汇总
数据集介绍
main_image_url
构建方式
POP-ROK数据集通过将约30种不同的原声鼓组合与涵盖基本节奏模式的MIDI数据集配对,生成了一系列合成鼓录音。数据增强过程中采用了随机鼓交换方法,以创建独特的鼓组合,并通过混响模拟来表现不同房间大小的声学效果。此数据集旨在通过配对的鼓音符标签,训练或微调AI模型,以模拟现场鼓声的效果。
特点
POP-ROK数据集包含5,378个未压缩的立体声WAV格式的音频循环,总时长约24小时,采样率为44.1kHz,位深度为16位。其节奏范围为100-130 BPM,涵盖多种子流派风格,如流行、经典摇滚、软摇滚和乡村音乐。每个音频文件都配有JSON格式的标签数据,支持生成音乐、特征提取、节奏分析等多种机器学习应用。
使用方法
用户可通过直接下载WAV和JSON文件来获取POP-ROK数据集。数据集适用于训练或微调AI模型,特别是在节奏记谱、音频分类和音乐信息检索等领域。使用时,建议参考提供的文件名标签,如bpm、pop、rok、drm和id,以更好地理解和利用数据。若用于研究或开发项目,请按照提供的引用格式进行引用。
背景与挑战
背景概述
POP-ROK数据集是由WaivOps开发的一个开放音频数据集,专注于提供未经筛选的流行摇滚风格合成鼓录音。该数据集包含5,378个未压缩的立体声WAV格式音频循环,并配有用于监督训练生成AI音频模型的JSON文件。POP-ROK数据集的开发基于约30套原声鼓组,结合涵盖基本节奏模式的MIDI数据集,通过数据增强技术如随机鼓交换和混响模拟,生成独特的鼓组和不同房间大小的声音效果。其主要目的是为音乐和音频领域的机器学习应用提供可访问的内容,旨在训练或微调AI模型以实现节奏记谱和鼓声再现。
当前挑战
POP-ROK数据集在构建过程中面临多项挑战。首先,合成鼓录音的多样性和质量控制是一个关键问题,确保每条录音在音质和风格上的一致性。其次,数据增强技术的应用,如随机鼓交换和混响模拟,需要精确的算法设计以避免失真或不自然的声音效果。此外,与MIDI数据集的配对和标签数据的准确性也是一大挑战,确保每条音频循环与其对应的节奏模式和鼓声标签精确匹配。最后,数据集的版权问题和合法性需要严格管理,确保所有录音均来自经过验证的来源并获得版权许可。
常用场景
经典使用场景
在音乐生成与分析领域,POP-ROK数据集以其丰富的合成鼓录音资源,成为训练和微调生成式AI音频模型的理想选择。该数据集包含5,378个无压缩的立体声WAV格式音频循环,以及相应的JSON文件,这些文件为监督学习提供了精确的节奏标签。通过这些数据,研究人员能够开发出能够模仿现场鼓声的AI模型,从而在音乐创作和音频处理中实现更高的真实感和多样性。
实际应用
在实际应用中,POP-ROK数据集被广泛用于音乐制作、声音设计和信号处理等领域。音乐制作人可以利用该数据集训练的AI模型,快速生成符合特定风格的鼓声,从而提高创作效率。声音设计师则可以借助这些数据进行音效合成,创造出更加逼真的音效。此外,该数据集还在教育领域有所应用,帮助学生和研究人员更好地理解和掌握音频处理技术。
衍生相关工作
POP-ROK数据集的发布催生了一系列相关研究和工作,特别是在音乐生成和音频处理领域。例如,有研究者利用该数据集开发了新的节奏检测算法,显著提高了节奏识别的准确性。此外,还有团队基于此数据集构建了音乐生成系统,能够自动创作出具有特定风格的音乐作品。这些衍生工作不仅丰富了音乐科技的研究内容,也为实际应用提供了新的工具和方法。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作