free-music-archive-full

Hugging Face2026-04-15 更新2026-04-16 收录

下载链接：

https://huggingface.co/datasets/Palak2506/free-music-archive-full

下载链接

链接失效反馈

官方服务：

资源简介：

Free Music Archive (FMA) 是一个开放且易于访问的音乐数据集，专为音乐信息检索（MIR）任务设计。数据集包含 106,199 条未修剪长度的音频片段，总计 8,104 小时的音频内容，涵盖 161 种音乐流派。每条音频均附带丰富的元数据，包括标题、艺术家、作曲家、流派、标签、发布时间、语言、播放次数等。数据集以 Parquet 文件格式提供，总大小为 593 GB，相比原始 ZIP 文件节省了约 34% 的空间。FMA 适用于多种 MIR 任务，如流派识别、音频分类和音频到音频的转换。所有音频文件均采用 Creative Commons 系列许可证，部分文件允许商业使用。数据集还提供了预计算的特征和分层分类信息，方便研究人员使用。

创建时间：

2026-04-15

原始信息汇总

Free Music Archive - Full 数据集概述

数据集基本信息

数据集名称：Free Music Archive - Full
数据集地址：https://huggingface.co/datasets/Palak2506/free-music-archive-full
许可协议：cc
数据规模：100K<n<1M
任务类别：audio-to-audio, audio-classification
数据格式：Parquet文件

数据内容与规模

总样本数：106,199条音频片段
总时长：8,104小时（未修剪长度）
原始数据总量：917 GiB（343天音频）
本版本数据集大小：593 GB（相比原始ZIP文件节省约34%空间）
数据划分：仅包含一个“train”划分，包含106,198个样本，占用约485.82 GB。

数据来源与构成

原始来源：Free Music Archive (FMA)
音频数量：来自106,574首曲目
艺术家数量：16,341位
专辑数量：14,854张
流派分类：包含161种流派的层次化分类体系

数据特征（Features）

数据集包含以下字段：

audio：音频数据
title：曲目标题
url：URL
artist：艺术家
composer：作曲者
lyricist：作词者
publisher：出版商
genres：流派序列（共164个类别，包括“20th Century Classical”至“hiphop”）
tags：标签序列
released：发布时间戳
language：语言
listens：收听次数
artist_url：艺术家URL
artist_website：艺术家网站
album_title：专辑标题
album_url：专辑URL
license：许可协议（共35种类型，包括“CC-BY 1.0”至“Free Music Philosophy (FMP)”）
copyright：版权信息
explicit：是否包含露骨内容（是/否）
instrumental：是否为器乐（是/否）
allow_commercial_use：是否允许商业使用（是/否）
allow_derivatives：是否允许衍生作品（是/否）
require_attribution：是否需要署名（是/否）
require_share_alike：是否要求相同方式共享（是/否）

数据预处理与打包说明

文件移除：173个文件因libsndfile / libmpg123无法读取而被移除；202个文件因许可协议不明确或全文不可用而被移除。
音频重编码：为统一编码，所有音频均使用libmpg123重新编码。
打包格式：数据以Parquet文件格式打包。

许可协议信息

FMA代码库：采用MIT许可证。
FMA元数据：采用CC-BY 4.0许可证。
音频文件：采用多种知识共享系列许可协议及少量其他协议，每个文件均附有其许可协议及重要条款枚举。
主要许可协议时长分布：前三位为CC-BY-NC-SA 3.0（34.16%）、CC-BY-NC-ND 3.0（28.34%）、CC-BY-NC-ND 4.0（12.57%）。

引用格式

@inproceedings{fma_dataset, title = {{FMA}: A Dataset for Music Analysis}, author = {Defferrard, Micha"el and Benzi, Kirell and Vandergheynst, Pierre and Bresson, Xavier}, booktitle = {18th International Society for Music Information Retrieval Conference (ISMIR)}, year = {2017}, archiveprefix = {arXiv}, eprint = {1612.01840}, url = {https://arxiv.org/abs/1612.01840}, }

@inproceedings{fma_challenge, title = {Learning to Recognize Musical Genre from Audio}, subtitle = {Challenge Overview}, author = {Defferrard, Micha"el and Mohanty, Sharada P. and Carroll, Sean F. and Salathe, Marcel}, booktitle = {The 2018 Web Conference Companion}, year = {2018}, publisher = {ACM Press}, isbn = {9781450356404}, doi = {10.1145/3184558.3192310}, archiveprefix = {arXiv}, eprint = {1803.05337}, url = {https://arxiv.org/abs/1803.05337}, }

搜集汇总

数据集介绍

构建方式

在音乐信息检索领域，大规模音频数据的稀缺长期制约着特征学习和端到端模型的进展。Free Music Archive (FMA) 数据集通过系统性地整合自由音乐档案馆中的资源，构建了一个覆盖广泛、结构清晰的音乐库。该数据集汇集了来自16,341位艺术家的106,574条音轨，总计917 GiB的全长高保真音频，所有内容均采用知识共享系列许可协议。构建过程中，研究团队依据明确的许可条款筛选音轨，移除了许可信息不明确或音频文件损坏的条目，并通过重新编码确保了音频格式的一致性，最终将数据整理为包含161种流派的层次化分类体系。

特点

该数据集以其宏大的规模和精细的注解体系脱颖而出，提供了超过八千小时的未裁剪音频，涵盖了从古典、爵士到电子、嘻哈等161种音乐流派，呈现出丰富的音乐多样性。每条音轨不仅包含音频本身，还附有详尽的元数据，如曲目标题、艺术家、专辑信息、流派标签、发行时间、播放量以及精确的许可条款细节。这种多层次的信息结构为音乐分析任务提供了坚实的基础，使得研究者能够同时利用音频信号和丰富的上下文信息进行模型训练与评估。

使用方法

对于希望利用该数据集的研究者，可以通过HuggingFace平台直接加载预处理好的Parquet格式文件，从而便捷地访问音频数据及其关联的元数据字段。该数据集适用于音频分类、音乐流派识别、音频特征提取及音乐生成等多种音乐信息检索任务。用户可根据研究需求，利用其内置的许可信息字段筛选出允许商业使用或衍生的子集，确保模型训练与应用符合版权规范。数据集的标准化格式与丰富注释为开发先进的机器学习模型提供了即用型的高质量资源。

背景与挑战

背景概述

在音乐信息检索领域，大规模、高质量且标注丰富的音频数据集长期匮乏，制约了基于特征学习和端到端学习的算法发展。Free Music Archive（FMA）数据集由Michaël Defferrard、Kirell Benzi等研究人员于2017年创建，旨在为音乐分析任务提供一个开放、易访问的资源库。该数据集汇集了超过10万首采用知识共享许可的完整长度高音质音频，涵盖161种音乐流派，并附有曲目、艺术家、专辑等多层次元数据。FMA的发布显著推动了音乐自动分类、内容检索及推荐系统等研究方向，成为该领域基准测试的重要基石。

当前挑战

FMA数据集致力于解决音乐自动流派分类这一核心问题，其挑战在于音乐流派本身具有主观性和模糊边界，同一曲目可能跨越多个流派，且数据集中流派分布极不均衡，影响了分类模型的泛化能力。在构建过程中，研究团队面临音频文件编码格式混杂、部分文件无法读取等技术障碍，同时需逐一核查每首曲目的版权许可状态，确保法律合规性，这些因素均增加了数据清洗与标准化的复杂度。

常用场景

经典使用场景

在音乐信息检索领域，数据集的构建常面临规模与质量的权衡。Free Music Archive Full数据集以其庞大的音频体量和精细的元数据标注，为音乐自动分类任务提供了经典范例。研究者利用其超过十万条全长度音频轨道及161种流派标签，能够训练深度神经网络模型，实现高精度的音乐流派识别。该数据集支持从原始音频波形到高级语义特征的端到端学习，成为评估分类算法性能的基准平台。

实际应用

在商业与创意产业中，该数据集为音乐流媒体平台的智能推荐引擎提供了训练素材。其清晰的版权标注允许开发者筛选可商用的音频样本，用于生成背景音乐的自动化工具。教育机构亦可借助该资源设计音乐分析课程，而独立艺术家能通过数据集的开放特性探索风格融合与创新表达，实现艺术创作与技术应用的有机结合。

衍生相关工作

基于该数据集衍生的经典研究包括2018年ISMIR会议举办的音乐流派识别挑战赛，其推动了卷积神经网络在音频分类中的优化。后续工作如音乐情感分析、艺术家风格迁移等研究均以此为基础展开。数据集的多模态特性还催生了音频-文本跨模态检索模型的发展，为音乐生成与理解任务提供了可复现的实验框架。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集