ACOUSTICBRAINZ

github2022-11-16 更新2024-05-31 收录

下载链接：

https://github.com/kaggledevs/Datasets

下载链接

链接失效反馈

官方服务：

资源简介：

众包的歌曲声学信息，使用开放许可证提供下载。

Crowdsourced acoustic information of songs, available for download under an open license.

创建时间：

2018-03-19

原始信息汇总

数据集概述

本数据集集合涵盖了多个与音乐相关的领域，包括机器学习、人工智能、自然语言处理和深度学习。以下是各数据集的详细信息：

ACOUSTICBRAINZ
- 描述：公开授权的歌曲声学信息。
- 链接：ACOUSTICBRAINZ
FREESOUND DATASETS
- 描述：来自Freesound平台的开放音频集合。
- 链接：FREESOUND DATASETS
DUNYA
- 描述：多种非西方音乐曲目的音乐语料库及相关软件工具。
- 链接：DUNYA
COMPMUSIC datasets
- 描述：多种非西方音乐曲目的数据集集合。
- 链接：COMPMUSIC datasets
REPOVIZZ
- 描述：音乐表演多模态录音的数据仓库和可视化工具。
- 链接：REPOVIZZ
DREANSS
- 描述：已知音乐音频录音数据集中的鼓事件标注。
- 链接：DREANSS
EEP
- 描述：弦乐四重奏表演的多模态录音。
- 链接：EEP
FLABASE
- 描述：弗拉门戈音乐的知识库。
- 链接：FLABASE
GIANTSTEPS Key
- 描述：音乐音频集合的键标注。
- 链接：GIANTSTEPS Key
GIANTSTEPS Tempo
- 描述：音乐音频集合的速度标注。
- 链接：GIANTSTEPS Tempo
GOOD-SOUNDS
- 描述：多种乐器演奏的单音和音阶录音。
- 链接：GOOD-SOUNDS
IRMAS
- 描述：音乐音频片段及其主导乐器的标注。
- 链接：IRMAS
Last.fm Dataset 360k users - Last.fm Dataset 1k users
- 描述：来自Last.fm的<用户, 艺术家-mbid, 艺术家-名称, 总播放次数>元组。
- 链接：Last.fm Dataset
MARD
- 描述：亚马逊客户评论的文本及伴随元数据。
- 链接：MARD
MASS
- 描述：用于音频源分离研究的多轨录音。
- 链接：MASS
MTG-QBH
- 描述：用于Query-by-Humming研究的歌唱旋律录音。
- 链接：MTG-QBH
ORCHSET
- 描述：带有旋律提取研究标注的管弦乐音乐片段。
- 链接：ORCHSET
PHENICX-Anechoic
- 描述：Aalto无回声管弦乐数据库的去噪录音和音符标注。
- 链接：PHENICX-Anechoic
PHENICX-emotion
- 描述：贝多芬的Eroica交响乐片段及音频描述符。
- 链接：PHENICX-emotion
QUARTET
- 描述：弦乐四重奏表演的多模态数据。
- 链接：QUARTET
SAS
- 描述：用于语义艺术家相似性研究的艺术家人物列表及传记信息。
- 链接：SAS
TONAS
- 描述：弗拉门戈无伴奏歌唱旋律及手动转录。
- 链接：TONAS
Haydn Quartets
- 描述：海顿的弦乐四重奏Op. 20的乐谱及和声标注。
- 链接：Haydn Quartets

搜集汇总

数据集介绍

构建方式

ACOUSTICBRAINZ数据集的构建依托于众包模式，通过开放许可的方式收集了大量歌曲的声学信息。该数据集的核心数据来源于全球用户的贡献，涵盖了广泛的音乐风格和类型。数据的采集过程依赖于用户上传的音频文件，并通过自动化工具提取声学特征，如节奏、音调、音色等。这种众包模式不仅确保了数据的多样性和广泛性，还通过开放许可机制促进了数据的自由共享与再利用。

特点

ACOUSTICBRAINZ数据集以其丰富的声学特征和开放许可的特点脱颖而出。数据集中的每首歌曲都附带了详细的声学描述，包括但不限于节奏、音调、音色、动态范围等特征。这些特征为音乐信息检索、音乐推荐系统以及音乐情感分析等研究提供了坚实的基础。此外，数据集的开放许可机制使得研究人员和开发者能够自由地访问和使用这些数据，极大地推动了音乐信息学领域的研究进展。

使用方法

ACOUSTICBRAINZ数据集的使用方法灵活多样，适用于多种音乐信息学研究场景。研究人员可以通过访问数据集官网下载所需的声学特征数据，并利用这些数据进行音乐分类、情感分析或推荐系统的开发。数据集提供了多种格式的数据文件，便于不同编程语言和工具的处理。此外，数据集还附带了详细的文档和示例代码，帮助用户快速上手并开展相关研究。

背景与挑战

背景概述

ACOUSTICBRAINZ数据集是一个由社区众包构建的开放音乐声学信息数据库，旨在为音乐信息检索和音频分析领域提供丰富的声学特征数据。该数据集由MusicBrainz社区与多个研究机构合作开发，首次发布于2015年，涵盖了大量歌曲的声学特征，包括音高、节奏、音色等。其核心研究问题在于如何通过声学特征实现音乐的自动分类、推荐和分析。ACOUSTICBRAINZ的开放性和多样性使其成为音乐信息检索领域的重要资源，推动了音乐分析算法的创新与发展。

当前挑战

ACOUSTICBRAINZ数据集在解决音乐声学特征提取与分析问题时面临多重挑战。首先，音乐声学特征的多样性和复杂性使得特征提取的准确性难以保证，尤其是在处理不同风格和文化的音乐时。其次，众包数据的质量参差不齐，可能导致数据噪声和不一致性，影响模型的训练效果。此外，数据集构建过程中需要处理大量音频文件，涉及复杂的元数据管理和存储优化问题。如何在保证数据质量的同时实现高效的数据处理与共享，是该数据集构建过程中亟待解决的技术难题。

常用场景

经典使用场景

ACOUSTICBRAINZ数据集在音乐信息检索和音频特征分析领域具有广泛的应用。通过其提供的众包音频信息，研究人员能够深入探索音乐作品的声学特性，如音色、节奏和和声结构。这些数据为音乐推荐系统、自动音乐分类和情感分析等任务提供了坚实的基础。

解决学术问题

ACOUSTICBRAINZ数据集解决了音乐信息检索中的关键问题，如音频特征的自动提取与分类。通过提供大量开放许可的音乐声学数据，研究人员能够开发更精确的算法来识别音乐风格、情感和乐器使用情况。这不仅推动了音乐信息学的发展，还为跨学科研究提供了宝贵的资源。

衍生相关工作

基于ACOUSTICBRAINZ数据集，许多经典研究工作得以展开。例如，研究人员开发了基于深度学习的音乐情感分析模型，能够自动识别音乐中的情感特征。此外，该数据集还催生了一系列音乐风格分类算法，这些算法在音乐推荐和版权管理等领域得到了广泛应用。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集