wearemusicai/moisesdb
收藏MoisesDB 数据集概述
数据集描述
- 主页: MoisesDB 主页
- 仓库: MoisesDB 仓库
- 论文: Moisesdb: A dataset for source separation beyond 4-stems
- 联系人: Igor Pereira
数据集总结
MoisesDB 是一个用于源分离的数据集。它提供了一系列音轨及其分离的音轨(如人声、贝斯、鼓等)。该数据集用于评估源分离算法的性能。
数据下载
请在研究网站下载数据集,解压并相应配置环境变量 MOISESDB_PATH。
shell export MOISESDB_PATH=./moises-db-data
目录结构应为:
moisesdb: moisesdb_v0.1 track uuid 0 track uuid 1 . . .
安装
您可以使用以下命令安装此包:
shell pip install git+https://github.com/moises-ai/moises-db.git
使用方法
MoisesDB
下载并配置数据集路径后,您可以创建 MoisesDB 实例以访问音轨。您还可以通过 data_path 参数提供数据集路径。
python from moisesdb.dataset import MoisesDB
db = MoisesDB( data_path=./moisesdb, sample_rate=44100 )
MoisesDB 对象具有迭代器属性,可用于访问数据集中的所有文件。
python n_songs = len(db) track = db[0] # 返回一个 MoisesDBTrack 对象
MoisesDBTrack
MoisesDBTrack 对象包含数据集中音轨的信息,可以实时混合音轨和多个源。
您可以通过 stems 和 audio 属性访问所有音轨和混合音轨。stems 属性返回一个字典,键为可用音轨,值为 nd.array。audio 属性返回混合音轨的 nd.array。
python track = db[0] stems = track.stems # stems = {vocals: ..., bass: ..., ...} mixture = track.audio # mixture = nd.array
MoisesDBTrack 对象还包含音轨的其他非音频信息,如:
track.idtrack.providertrack.artisttrack.nametrack.genretrack.sourcestrack.bleedingstrack.activity
音轨和混合音轨是实时计算的。您可以使用 MoisesDBTrack 的 save_stems 方法创建仅包含音轨的数据集版本。
python track = db[0] path = ./moises-db-stems/0 track.save_stems(path)
性能评估
我们在 MoisesDB 上运行了一些源分离算法和预言方法,以评估每个音轨的性能。这些结果位于 benchmark 文件夹中的 csv 文件中。
引用
如果您在研究中使用了 MoisesDB 数据集,请引用以下论文:
bibtex @misc{pereira2023moisesdb, title={Moisesdb: A dataset for source separation beyond 4-stems}, author={Igor Pereira and Felipe Araújo and Filip Korzeniowski and Richard Vogl}, year={2023}, eprint={2307.15913}, archivePrefix={arXiv}, primaryClass={cs.SD} }
许可
MoisesDB 使用 NC-RCL 许可证分发。
"Non-Commercial Research Community license (NC-RCL)
Limited Redistribution: 您可以在任何媒介或格式中复制和使用提供的音频材料,只要仅用于研究社区中的非商业目的,并且仅通过 moises.ai 平台或其他明确授权的平台进行重新分发。未经许可方书面同意,不得在授权平台之外进行重新分发。
Attribution: 您必须给予适当的署名(包括艺术家名称和歌曲标题),并提供指向此许可证或指示此许可证条款的通知。
Non-Commercial Use: 您不得将材料用于任何商业目的或经济利益。这包括但不限于材料的销售、许可或租赁,以及任何主要目的是产生收入或利润的使用。
No Derivative Works: 除非艺术家明确允许,否则您不得创建、混音、改编或基于材料构建。
Preservation of Legal Notices: 您不得移除材料中包含或附带的任何版权或其他专有声明。
Termination: 如果您未能遵守此许可证,您使用材料的权限将自动终止。
Voice Cloning Restriction: 您不得使用人声音轨或音频材料的任何部分创建艺术家的公开数字声音模仿(例如:声音克隆或复制品)。这包括但不限于使用语音合成技术、深度学习算法和其他基于人工智能的工具。"




