free-music-archive-commercial-16khz-full

Hugging Face2024-09-09 更新2024-12-12 收录

下载链接：

https://huggingface.co/datasets/benjamin-paine/free-music-archive-commercial-16khz-full

下载链接

链接失效反馈

官方服务：

资源简介：

FMA数据集是一个开放且易于访问的音乐数据集，适用于音乐信息检索（MIR）领域的多个任务。数据集包含917 GiB的音频数据，涵盖343天的音频内容，来自106,574首曲目、16,341位艺术家和14,854张专辑，按161个音乐流派分类。数据集提供了完整的音频文件、预计算的特征、曲目和用户级别的元数据、标签以及自由文本信息。此外，数据集还提供了训练/验证/测试的划分和三个子集，讨论了适合的MIR任务，并评估了一些流派识别的基线。

创建时间：

2024-09-09

原始信息汇总

Free Music Archive Commercial 16 KHz - Full 数据集概述

数据集信息

特征

audio: 音频数据
title: 音乐标题
url: 音乐文件的URL
artist: 艺术家名称
album_title: 专辑标题
license: 许可证类型
- 类别标签:
  - 0: CC-BY 1.0
  - 1: CC-BY 2.0
  - 2: CC-BY 2.5
  - 3: CC-BY 3.0
  - 4: CC-BY 4.0
  - 5: CC-Sampling+ 1.0
  - 6: CC0 1.0
  - 7: FMA Sound Recording Common Law
  - 8: Free Art License
  - 9: Public Domain Mark 1.0
copyright: 版权信息

数据分割

train: 训练集
- 样本数量: 8802
- 数据大小: 6492778912.662 字节

数据集大小

下载大小: 10506892695 字节
数据集大小: 6492778912.662 字节

配置

config_name: default
- 数据文件路径: data/train-*

许可证

数据集许可证: CC-BY 4.0

任务类别

audio-to-audio
audio-classification

数据集名称

pretty_name: Free Music Archive Commercial 16 KHz - Full

数据集描述

数据集内容

包含8802个样本，总时长531小时，占用10.5 GB磁盘空间。
音频数据为16 KHz采样率，未修剪长度。

许可证信息

数据集中的每个文件都有其对应的许可证，许可证类型包括：
- CC-BY 1.0
- CC-BY 2.0
- CC-BY 2.5
- CC-BY 3.0
- CC-BY 4.0
- CC-Sampling+ 1.0
- CC0 1.0
- FMA Sound Recording Common Law
- Free Art License
- Public Domain Mark 1.0

许可证分布

许可证类型	总时长 (百分比)
CC-BY 4.0	377.0小时 (4.65%)
CC-BY 3.0	106.9小时 (1.32%)
FMA Sound Recording Common Law	19.9小时 (0.25%)
CC0 1.0	10.5小时 (0.13%)
CC-BY 1.0	10.4小时 (0.13%)
Free Art License	2.7小时 (0.03%)
CC-BY 2.0	2.5小时 (0.03%)
CC-Sampling+ 1.0	53.9分钟 (0.01%)
CC-BY 2.5	11.2分钟 (0.00%)

引用

@inproceedings{fma_dataset, title = {{FMA}: A Dataset for Music Analysis}, author = {Defferrard, Micha"el and Benzi, Kirell and Vandergheynst, Pierre and Bresson, Xavier}, booktitle = {18th International Society for Music Information Retrieval Conference (ISMIR)}, year = {2017}, archiveprefix = {arXiv}, eprint = {1612.01840}, url = {https://arxiv.org/abs/1612.01840}, }

搜集汇总

数据集介绍

构建方式

Free Music Archive Commercial 16 KHz - Full 数据集是通过整合来自16,341位艺术家和14,854张专辑的106,574首音乐曲目构建而成。这些曲目均采用Creative Commons许可，涵盖了161种音乐流派。数据集提供了完整的音频文件、预计算的特征以及丰富的元数据，包括曲目标题、艺术家信息、专辑名称和详细的许可信息。数据集的构建旨在为音乐信息检索（MIR）领域的研究提供高质量的音频资源，支持从特征学习到端到端学习的多种任务。

特点

该数据集的特点在于其广泛的音乐流派覆盖和高质量的音频资源。数据集包含8,802个未经剪辑的音频样本，总时长达531小时，占用10.5 GB的存储空间。每个音频样本都附带了详细的元数据，如曲目标题、艺术家、专辑名称和许可信息，这些信息为音乐分析和分类任务提供了丰富的上下文。此外，数据集特别筛选了商业许可的样本，确保其在商业应用中的可用性。

使用方法

Free Music Archive Commercial 16 KHz - Full 数据集适用于多种音乐信息检索任务，如音频分类、流派识别和音频到音频的转换。研究人员可以通过下载数据集并使用提供的预计算特征和元数据进行实验。数据集的音频文件以16 KHz的采样率提供，适合进行高质量的音频分析。此外，数据集的分割配置（train/validation/test）和子集划分（small/medium/large）为模型训练和评估提供了便利。使用该数据集时，需注意每个音频文件的许可信息，以确保合规使用。

背景与挑战

背景概述

Free Music Archive Commercial 16 KHz - Full 数据集由Michaël Defferrard、Kirell Benzi、Pierre Vandergheynst和Xavier Bresson等研究人员于2017年发布，旨在为音乐信息检索（MIR）领域提供一个开放且易于访问的数据集。该数据集包含了来自16,341位艺术家的106,574首音乐曲目，涵盖了161种音乐流派，总容量达917 GiB，时长343天。数据集不仅提供了完整的音频文件，还包含了预计算的特征、曲目和用户级别的元数据、标签以及自由文本描述。该数据集的发布极大地推动了MIR领域的研究，尤其是在特征学习和端到端学习方面，为音乐分类、流派识别等任务提供了丰富的资源。

当前挑战

Free Music Archive Commercial 16 KHz - Full 数据集在构建和应用过程中面临多重挑战。首先，音乐信息检索领域的核心问题在于如何从海量音频数据中提取有效特征并进行准确的分类和识别，而该数据集虽然规模庞大，但音频数据的多样性和复杂性增加了模型训练的难度。其次，数据集的构建过程中，研究人员需要处理大量不同格式和质量的音频文件，并确保其版权信息的准确性和合法性，这对数据集的整理和标注提出了极高的要求。此外，尽管数据集提供了丰富的元数据，但如何有效利用这些信息进行多模态学习仍是一个亟待解决的问题。

常用场景

经典使用场景

在音乐信息检索（MIR）领域，Free Music Archive Commercial 16 KHz - Full数据集被广泛用于音乐分类、音频特征提取和音乐推荐系统的开发。该数据集提供了丰富的音频样本和详细的元数据，使得研究人员能够深入探索音乐的结构和风格，从而推动音乐信息检索技术的发展。

衍生相关工作

基于该数据集，许多经典的研究工作得以展开，如音乐流派识别、音频特征提取和音乐情感分析。这些研究不仅推动了音乐信息检索领域的发展，还为其他相关领域如语音识别和音频处理提供了宝贵的参考和借鉴。

数据集最近研究