five

wearemusicai/moisesdb|音频处理数据集|源分离数据集

收藏
hugging_face2024-11-28 更新2024-03-04 收录
音频处理
源分离
下载链接:
https://hf-mirror.com/datasets/wearemusicai/moisesdb
下载链接
链接失效反馈
资源简介:
MoisesDB是一个用于源分离的数据集,提供了音轨及其分离的干音(如人声、贝斯、鼓等)。该数据集用于评估源分离算法的性能。

MoisesDB是一个用于源分离的数据集,提供了音轨及其分离的干音(如人声、贝斯、鼓等)。该数据集用于评估源分离算法的性能。
提供机构:
wearemusicai
原始信息汇总

MoisesDB 数据集概述

数据集描述

数据集总结

MoisesDB 是一个用于源分离的数据集。它提供了一系列音轨及其分离的音轨(如人声、贝斯、鼓等)。该数据集用于评估源分离算法的性能。

数据下载

请在研究网站下载数据集,解压并相应配置环境变量 MOISESDB_PATH

shell export MOISESDB_PATH=./moises-db-data

目录结构应为:

moisesdb: moisesdb_v0.1 track uuid 0 track uuid 1 . . .

安装

您可以使用以下命令安装此包:

shell pip install git+https://github.com/moises-ai/moises-db.git

使用方法

MoisesDB

下载并配置数据集路径后,您可以创建 MoisesDB 实例以访问音轨。您还可以通过 data_path 参数提供数据集路径。

python from moisesdb.dataset import MoisesDB

db = MoisesDB( data_path=./moisesdb, sample_rate=44100 )

MoisesDB 对象具有迭代器属性,可用于访问数据集中的所有文件。

python n_songs = len(db) track = db[0] # 返回一个 MoisesDBTrack 对象

MoisesDBTrack

MoisesDBTrack 对象包含数据集中音轨的信息,可以实时混合音轨和多个源。

您可以通过 stemsaudio 属性访问所有音轨和混合音轨。stems 属性返回一个字典,键为可用音轨,值为 nd.arrayaudio 属性返回混合音轨的 nd.array

python track = db[0] stems = track.stems # stems = {vocals: ..., bass: ..., ...} mixture = track.audio # mixture = nd.array

MoisesDBTrack 对象还包含音轨的其他非音频信息,如:

  • track.id
  • track.provider
  • track.artist
  • track.name
  • track.genre
  • track.sources
  • track.bleedings
  • track.activity

音轨和混合音轨是实时计算的。您可以使用 MoisesDBTracksave_stems 方法创建仅包含音轨的数据集版本。

python track = db[0] path = ./moises-db-stems/0 track.save_stems(path)

性能评估

我们在 MoisesDB 上运行了一些源分离算法和预言方法,以评估每个音轨的性能。这些结果位于 benchmark 文件夹中的 csv 文件中。

引用

如果您在研究中使用了 MoisesDB 数据集,请引用以下论文:

bibtex @misc{pereira2023moisesdb, title={Moisesdb: A dataset for source separation beyond 4-stems}, author={Igor Pereira and Felipe Araújo and Filip Korzeniowski and Richard Vogl}, year={2023}, eprint={2307.15913}, archivePrefix={arXiv}, primaryClass={cs.SD} }

许可

MoisesDB 使用 NC-RCL 许可证分发。

"Non-Commercial Research Community license (NC-RCL)

Limited Redistribution: 您可以在任何媒介或格式中复制和使用提供的音频材料,只要仅用于研究社区中的非商业目的,并且仅通过 moises.ai 平台或其他明确授权的平台进行重新分发。未经许可方书面同意,不得在授权平台之外进行重新分发。

Attribution: 您必须给予适当的署名(包括艺术家名称和歌曲标题),并提供指向此许可证或指示此许可证条款的通知。

Non-Commercial Use: 您不得将材料用于任何商业目的或经济利益。这包括但不限于材料的销售、许可或租赁,以及任何主要目的是产生收入或利润的使用。

No Derivative Works: 除非艺术家明确允许,否则您不得创建、混音、改编或基于材料构建。

Preservation of Legal Notices: 您不得移除材料中包含或附带的任何版权或其他专有声明。

Termination: 如果您未能遵守此许可证,您使用材料的权限将自动终止。

Voice Cloning Restriction: 您不得使用人声音轨或音频材料的任何部分创建艺术家的公开数字声音模仿(例如:声音克隆或复制品)。这包括但不限于使用语音合成技术、深度学习算法和其他基于人工智能的工具。"

AI搜集汇总
数据集介绍
main_image_url
构建方式
MoisesDB数据集的构建,旨在为音频源分离领域提供一套全面的测试与评估资源。该数据集通过搜集具有不同音乐元素(如人声、贝斯、鼓等)的音轨,并对其进行分离处理,构建出一个包含原始音轨及其对应分离音轨的集合。每一音轨都被细分为多个音源部分,以供研究者对源分离算法的性能进行准确评估。
使用方法
使用MoisesDB数据集,首先需要从官方网站下载并正确配置环境变量。通过pip安装相关包后,可以创建MoisesDB的实例来访问音轨数据。用户可以利用数据集提供的迭代器属性遍历所有文件,并通过MoisesDBTrack对象获取音轨的详细信息,包括音源混合、音轨识别信息以及其他非音频信息。数据集还支持保存分离的音轨,以便进行后续的分析和评估。
背景与挑战
背景概述
MoisesDB数据集,作为音频源分离领域的宝贵资源,由Igor Pereira等研究人员于2023年构建。该数据集旨在为源分离算法提供评估基准,包含了丰富的音轨及其分离的音轨部分(如人声、贝斯、鼓点等),为音乐信息检索、音频处理等领域的研究提供了坚实基础。MoisesDB不仅推动了音频源分离技术的发展,也对该领域的研究产生了深远影响,成为相关研究不可或缺的参考数据集。
当前挑战
MoisesDB数据集面临的挑战主要体现在两个方面:一是领域问题层面,如何更精确地实现多声道音频的源分离,特别是在复杂音乐结构的处理上;二是构建过程中的挑战,包括高质量音频数据的采集、处理和存储,以及数据集的版权和使用权问题。这些挑战对于推动数据集的进一步发展和完善具有重要意义。
常用场景
经典使用场景
在音频处理与音乐信息检索领域,MoisesDB数据集之重要用途在于为研究者提供了一个评估源分离算法性能的标准化平台。该数据集包含多首音乐的分离音轨,如人声、贝斯、鼓等,使得研究人员能够对其算法进行精确的基准测试,从而优化算法的准确性及效率。
解决学术问题
MoisesDB数据集解决了音乐源分离领域中的一个关键问题,即缺乏一个具有多样性和复杂性的大型数据集。它提供了超过四轨分离的音频数据,这对于研究如何处理更加复杂音频场景的分离算法至关重要,从而推动了音乐源分离技术的进步。
实际应用
实际应用中,MoisesDB数据集的成果被广泛用于音乐制作、音频编辑软件以及流媒体服务中的实时音频处理。例如,通过使用该数据集训练的算法,可以在不损害音质的情况下,实现音乐内容的个性化调整,以满足不同用户的听觉偏好。
数据集最近研究
最新研究方向
在音频处理领域,源分离技术的研究正日益深入。MoisesDB数据集作为该领域的重要资源,提供了丰富的音轨及其分离的茎(人声、贝斯、鼓等)。近期的研究方向集中在如何利用该数据集评估源分离算法的性能,特别是在4个茎以外的分离效果。该数据集的发布不仅促进了学术界的交流,也为源分离技术的实际应用提供了可靠的数据支持,其影响力和意义不容小觑。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国食物成分数据库

食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。

国家人口健康科学数据中心 收录

China Health and Nutrition Survey (CHNS)

China Health and Nutrition Survey(CHNS)是一项由美国北卡罗来纳大学人口中心与中国疾病预防控制中心营养与健康所合作开展的长期开放性队列研究项目,旨在评估国家和地方政府的健康、营养与家庭计划政策对人群健康和营养状况的影响,以及社会经济转型对居民健康行为和健康结果的作用。该调查覆盖中国15个省份和直辖市的约7200户家庭、超过30000名个体,采用多阶段随机抽样方法,收集了家庭、个体以及社区层面的详细数据,包括饮食、健康、经济和社会因素等信息。自2011年起,CHNS不断扩展,新增多个城市和省份,并持续完善纵向数据链接,为研究中国社会经济变化与健康营养的动态关系提供了重要的数据支持。

www.cpc.unc.edu 收录

RadDet

RadDet是一个包含11种雷达类别的数据集,包括6种新的低概率干扰(LPI)多相码(P1, P2, P3, P4, Px, Zadoff-Chu)和一种新的宽带调频连续波(FMCW)。数据集覆盖500 MHz频段,包含40,000个雷达帧,分为训练集、验证集和测试集。数据集在两种不同的雷达环境中提供:稀疏数据集(RadDet-1T)和密集数据集(RadDet-9T)。

github 收录

中国省级灾害统计空间分布数据集(1999-2020年)

该数据集为中国省级灾害统计空间分布数据集,时间为1999-2020年。该数据集包含中国各省自然灾害、地质灾害、地震灾害、森林火灾、森林病虫鼠害、草原灾害六类灾害的详细数据。数据量为206MB,数据格式为excel。

国家地球系统科学数据中心 收录

Wind Turbine Data

该数据集包含风力涡轮机的运行数据,包括风速、风向、发电量等参数。数据记录了多个风力涡轮机在不同时间点的运行状态,适用于风能研究和风力发电系统的优化分析。

www.kaggle.com 收录