five

wearemusicai/moisesdb

收藏
Hugging Face2024-11-28 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/wearemusicai/moisesdb
下载链接
链接失效反馈
官方服务:
资源简介:
MoisesDB是一个用于源分离的数据集,提供了音轨及其分离的干音(如人声、贝斯、鼓等)。该数据集用于评估源分离算法的性能。

MoisesDB是一个用于源分离的数据集,提供了音轨及其分离的干音(如人声、贝斯、鼓等)。该数据集用于评估源分离算法的性能。
提供机构:
wearemusicai
原始信息汇总

MoisesDB 数据集概述

数据集描述

数据集总结

MoisesDB 是一个用于源分离的数据集。它提供了一系列音轨及其分离的音轨(如人声、贝斯、鼓等)。该数据集用于评估源分离算法的性能。

数据下载

请在研究网站下载数据集,解压并相应配置环境变量 MOISESDB_PATH

shell export MOISESDB_PATH=./moises-db-data

目录结构应为:

moisesdb: moisesdb_v0.1 track uuid 0 track uuid 1 . . .

安装

您可以使用以下命令安装此包:

shell pip install git+https://github.com/moises-ai/moises-db.git

使用方法

MoisesDB

下载并配置数据集路径后,您可以创建 MoisesDB 实例以访问音轨。您还可以通过 data_path 参数提供数据集路径。

python from moisesdb.dataset import MoisesDB

db = MoisesDB( data_path=./moisesdb, sample_rate=44100 )

MoisesDB 对象具有迭代器属性,可用于访问数据集中的所有文件。

python n_songs = len(db) track = db[0] # 返回一个 MoisesDBTrack 对象

MoisesDBTrack

MoisesDBTrack 对象包含数据集中音轨的信息,可以实时混合音轨和多个源。

您可以通过 stemsaudio 属性访问所有音轨和混合音轨。stems 属性返回一个字典,键为可用音轨,值为 nd.arrayaudio 属性返回混合音轨的 nd.array

python track = db[0] stems = track.stems # stems = {vocals: ..., bass: ..., ...} mixture = track.audio # mixture = nd.array

MoisesDBTrack 对象还包含音轨的其他非音频信息,如:

  • track.id
  • track.provider
  • track.artist
  • track.name
  • track.genre
  • track.sources
  • track.bleedings
  • track.activity

音轨和混合音轨是实时计算的。您可以使用 MoisesDBTracksave_stems 方法创建仅包含音轨的数据集版本。

python track = db[0] path = ./moises-db-stems/0 track.save_stems(path)

性能评估

我们在 MoisesDB 上运行了一些源分离算法和预言方法,以评估每个音轨的性能。这些结果位于 benchmark 文件夹中的 csv 文件中。

引用

如果您在研究中使用了 MoisesDB 数据集,请引用以下论文:

bibtex @misc{pereira2023moisesdb, title={Moisesdb: A dataset for source separation beyond 4-stems}, author={Igor Pereira and Felipe Araújo and Filip Korzeniowski and Richard Vogl}, year={2023}, eprint={2307.15913}, archivePrefix={arXiv}, primaryClass={cs.SD} }

许可

MoisesDB 使用 NC-RCL 许可证分发。

"Non-Commercial Research Community license (NC-RCL)

Limited Redistribution: 您可以在任何媒介或格式中复制和使用提供的音频材料,只要仅用于研究社区中的非商业目的,并且仅通过 moises.ai 平台或其他明确授权的平台进行重新分发。未经许可方书面同意,不得在授权平台之外进行重新分发。

Attribution: 您必须给予适当的署名(包括艺术家名称和歌曲标题),并提供指向此许可证或指示此许可证条款的通知。

Non-Commercial Use: 您不得将材料用于任何商业目的或经济利益。这包括但不限于材料的销售、许可或租赁,以及任何主要目的是产生收入或利润的使用。

No Derivative Works: 除非艺术家明确允许,否则您不得创建、混音、改编或基于材料构建。

Preservation of Legal Notices: 您不得移除材料中包含或附带的任何版权或其他专有声明。

Termination: 如果您未能遵守此许可证,您使用材料的权限将自动终止。

Voice Cloning Restriction: 您不得使用人声音轨或音频材料的任何部分创建艺术家的公开数字声音模仿(例如:声音克隆或复制品)。这包括但不限于使用语音合成技术、深度学习算法和其他基于人工智能的工具。"

搜集汇总
数据集介绍
main_image_url
构建方式
MoisesDB数据集的构建,旨在为音频源分离领域提供一套全面的测试与评估资源。该数据集通过搜集具有不同音乐元素(如人声、贝斯、鼓等)的音轨,并对其进行分离处理,构建出一个包含原始音轨及其对应分离音轨的集合。每一音轨都被细分为多个音源部分,以供研究者对源分离算法的性能进行准确评估。
使用方法
使用MoisesDB数据集,首先需要从官方网站下载并正确配置环境变量。通过pip安装相关包后,可以创建MoisesDB的实例来访问音轨数据。用户可以利用数据集提供的迭代器属性遍历所有文件,并通过MoisesDBTrack对象获取音轨的详细信息,包括音源混合、音轨识别信息以及其他非音频信息。数据集还支持保存分离的音轨,以便进行后续的分析和评估。
背景与挑战
背景概述
MoisesDB数据集,作为音频源分离领域的宝贵资源,由Igor Pereira等研究人员于2023年构建。该数据集旨在为源分离算法提供评估基准,包含了丰富的音轨及其分离的音轨部分(如人声、贝斯、鼓点等),为音乐信息检索、音频处理等领域的研究提供了坚实基础。MoisesDB不仅推动了音频源分离技术的发展,也对该领域的研究产生了深远影响,成为相关研究不可或缺的参考数据集。
当前挑战
MoisesDB数据集面临的挑战主要体现在两个方面:一是领域问题层面,如何更精确地实现多声道音频的源分离,特别是在复杂音乐结构的处理上;二是构建过程中的挑战,包括高质量音频数据的采集、处理和存储,以及数据集的版权和使用权问题。这些挑战对于推动数据集的进一步发展和完善具有重要意义。
常用场景
经典使用场景
在音频处理与音乐信息检索领域,MoisesDB数据集之重要用途在于为研究者提供了一个评估源分离算法性能的标准化平台。该数据集包含多首音乐的分离音轨,如人声、贝斯、鼓等,使得研究人员能够对其算法进行精确的基准测试,从而优化算法的准确性及效率。
解决学术问题
MoisesDB数据集解决了音乐源分离领域中的一个关键问题,即缺乏一个具有多样性和复杂性的大型数据集。它提供了超过四轨分离的音频数据,这对于研究如何处理更加复杂音频场景的分离算法至关重要,从而推动了音乐源分离技术的进步。
实际应用
实际应用中,MoisesDB数据集的成果被广泛用于音乐制作、音频编辑软件以及流媒体服务中的实时音频处理。例如,通过使用该数据集训练的算法,可以在不损害音质的情况下,实现音乐内容的个性化调整,以满足不同用户的听觉偏好。
数据集最近研究
最新研究方向
在音频处理领域,源分离技术的研究正日益深入。MoisesDB数据集作为该领域的重要资源,提供了丰富的音轨及其分离的茎(人声、贝斯、鼓等)。近期的研究方向集中在如何利用该数据集评估源分离算法的性能,特别是在4个茎以外的分离效果。该数据集的发布不仅促进了学术界的交流,也为源分离技术的实际应用提供了可靠的数据支持,其影响力和意义不容小觑。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作