five

Lo-Fi Chords Dataset

收藏
github2025-12-05 更新2025-12-08 收录
下载链接:
https://github.com/patchbanks/Lo-Fi-Chords-Dataset
下载链接
链接失效反馈
官方服务:
资源简介:
Lo-Fi Chords Dataset是一个开放的音频数据集,包含8000个复古灵魂和图书馆制作音乐风格的和弦进行。它提供了8000个未压缩的立体声WAV格式音频循环,以及配对的JSON文件,包含用于训练生成AI音频模型的元数据。

Lo-Fi Chords Dataset is an open audio dataset that contains 8000 chord progressions in the styles of vintage soul and library production music. It provides 8000 uncompressed stereo WAV format audio loops, alongside paired JSON files carrying metadata for training generative AI audio models.
创建时间:
2025-12-05
原始信息汇总

Lo-Fi Chords Dataset 数据集概述

数据集简介

Lo-Fi Chords Dataset 是一个开放音频集合,包含复古灵魂乐和图书馆制作音乐风格的和弦进行。它包含 8,000 个未压缩立体声 WAV 格式的音频循环,以及配对的 JSON 元数据文件,用于训练生成式 AI 音频模型。

数据集概览

该数据集通过自定义脚本从 MIDI 模式和多采样乐器数据库中渲染音频而创建。录音采用各种原声、电声和合成器钢琴音源生成的扁平化和弦进行。数据增强策略包括人性化处理、时间偏移、滤波和均衡、磁带/黑胶噪声以及卷积混响建模。这些策略通过向训练示例展示多样化的钢琴音质和环境效果,增强了模型的泛化能力。

其主要目的是为模型开发、音频研究和音乐应用提供可访问的内容。示例用途包括文本到音频、风格迁移、特征提取、速度检测、音频分类、节奏分析、音乐信息检索 (MIR)、声音设计和信号处理。

技术规格

  • 音频数量与时长:8,000 个 8 小节音频循环(约 54 小时)
  • 音频格式:16 位立体声 WAV 格式,44.1 kHz 采样率
  • 速度范围:60–100 BPM
  • 文件配对:配对的元数据文件(WAV + JSON)
  • 乐器类型:三角钢琴、立式钢琴、电钢琴、Pianet、FM 合成器钢琴
  • 子流派风格:灵魂乐、复古图书馆音乐

许可信息

该数据集由 WaivOps(一个由 Patchbanks 管理的众包音乐项目)编制。所有录音均来自经过验证的作曲家和提供商,已获得版权许可。 Lo-Fi Chords Dataset 采用知识共享署名 4.0 国际许可协议 (CC BY 4.0) 进行许可。

下载链接

  • 元数据文件直接下载 (268.5 kB):https://zenodo.org/records/17819350/files/lofi_chords_dataset_json.tar.gz?download=1
  • 音频文件直接下载 (8.6 GB):https://zenodo.org/records/17819350/files/lofi_chords_dataset_wav_01.tar.gz?download=1
  • 音频文件直接下载 (8.8 GB):https://zenodo.org/records/17819350/files/lofi_chords_dataset_wav_02.tar.gz?download=1
  • 音频文件直接下载 (9.0 GB):https://zenodo.org/records/17819350/files/lofi_chords_dataset_wav_03.tar.gz?download=1
  • 音频文件直接下载 (1.9 GB):https://zenodo.org/records/17819350/files/lofi_chords_dataset_wav_04.tar.gz?download=1
  • 数据集 DOI:https://doi.org/10.5281/zenodo.17819350

文件名参考

标签 参考含义
bpm 音频文件的速度
lofi_chords_dataset 数据集名称
id 标识号
000000 播放列表曲目编号

引用方式

若在研究或开发中使用此数据集,请引用以下内容: bibtex @dataset{Lo-Fi Chords Dataset, author = {WaivOps}, title = {WaivOps Lo-Fi Chords Dataset: Open Audio Resources for Machine Learning in Music}, year = {2025}, doi = {10.5281/zenodo.17819350}, url = {https://doi.org/10.5281/zenodo.17819350}, }

搜集汇总
数据集介绍
main_image_url
构建方式
在音乐信息检索与生成式音频模型蓬勃发展的背景下,Lo-Fi Chords Dataset的构建体现了系统化的数据工程思维。其核心流程始于一个MIDI模式与多采样乐器数据库,通过定制化脚本将符号化的和弦进行渲染为原始音频。构建过程深度融合了数据增强策略,包括对演奏进行人性化处理、时间偏移、应用滤波与均衡,并叠加了磁带或黑胶噪声以及卷积混响建模。这些技术手段旨在模拟复古灵魂乐与图书馆制作音乐的风格特征,通过引入多样化的钢琴音色与丰富的环境效果,有效提升了数据集的复杂性与模型训练的泛化潜力。
使用方法
面向生成式人工智能音频模型开发与音乐信息检索研究,该数据集提供了多方面的应用路径。研究者可直接利用其音频-元数据对进行模型训练,适用于文本到音频生成、音频风格迁移、特征提取及音频分类等任务。在音乐信息检索领域,它可作为节奏分析、速度检测和信号处理算法的基准测试数据。用户需从指定平台下载分割的压缩包,解压后即可获得WAV音频文件及其对应的JSON元数据文件。数据集采用知识共享署名许可协议,确保了在规范引用前提下的广泛研究与商业应用自由。
背景与挑战
背景概述
在音乐信息检索与生成式人工智能音频模型蓬勃发展的背景下,高质量、标注清晰的音频数据集成为推动领域进步的关键基础设施。Lo-Fi Chords Dataset由WaivOps项目团队于2025年创建并发布,旨在为复古灵魂乐与图书馆制作音乐风格的和弦进行提供开放音频资源。该数据集包含8000个八小节音频循环及其配对元数据,核心研究问题聚焦于如何为文本到音频生成、风格迁移、节奏分析等任务提供结构化的训练素材。其采用多样化的钢琴音色与数据增强策略,显著提升了模型在复杂声学环境下的泛化能力,对音乐人工智能的应用开发与学术研究产生了积极影响。
当前挑战
该数据集致力于解决音乐生成与音频分析领域的一个核心挑战:如何获取大规模、高质量且版权清晰的特定风格音乐数据,以训练能够理解和生成复杂和弦结构与氛围感的AI模型。在构建过程中,团队面临多重技术挑战,包括从MIDI模式与多采样乐器库中渲染高质量音频的工程化实现,以及通过人性化处理、时间偏移、滤波均衡、磁带噪声模拟和卷积混响建模等一系列数据增强手段,在引入丰富声学变异性的同时,保持音乐内容的真实性与一致性。此外,确保所有录音素材来源于已验证的作曲者与提供方以完成版权清理,亦是数据集得以合法开放的关键环节。
常用场景
经典使用场景
在音乐信息检索与生成式人工智能音频模型的研究领域中,Lo-Fi Chords Dataset以其精心构建的复古灵魂乐与图书馆制作音乐风格的和弦进行音频循环,为模型训练提供了高质量的素材。该数据集最经典的使用场景在于文本到音频的生成任务,研究人员利用其八千条带有丰富元数据的音频片段,训练模型学习特定风格的音乐结构,从而生成具有连贯和声与节奏的新音频内容。
解决学术问题
该数据集有效解决了音乐人工智能领域几个关键的学术研究问题,特别是在数据稀缺与风格特异性建模方面。它为风格迁移、音频分类、节奏分析与特征提取等任务提供了标准化的基准,使得研究者能够系统性地评估模型在复杂音乐特征上的泛化能力。其包含的多重数据增强策略,如人性化处理与音效模拟,进一步帮助模型克服过拟合,推动了音乐表示学习与信号处理方法的创新。
实际应用
在实际应用层面,Lo-Fi Chords Dataset为音乐制作、声音设计及互动媒体产业带来了直接价值。开发者可以基于此数据集构建智能音乐生成工具,辅助创作者快速生成低保真风格的背景音乐或和弦素材。同时,其在节奏检测与音频分类方面的潜力,也支持了音乐流媒体平台的自动标签系统与个性化推荐引擎的开发,提升了音乐消费体验的智能化水平。
数据集最近研究
最新研究方向
在音乐信息检索与生成式人工智能音频模型快速发展的背景下,Lo-Fi Chords Dataset凭借其精心设计的复古灵魂乐风格和弦进行音频循环,为前沿研究提供了关键资源。当前研究热点聚焦于利用该数据集进行跨模态音乐生成,特别是文本到音频的合成任务,旨在通过模型学习低传真音乐的和声结构与氛围特征,实现风格可控的音乐创作。同时,数据集内包含的丰富元数据与多样化音色、效果处理,正推动音频风格迁移、节奏分析与音乐情感计算等方向的模型泛化能力提升,对促进个性化音乐生成与自动化音效设计具有显著意义。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作