five

极端金属声乐数据集 (EMVD)

收藏
arXiv2024-06-24 更新2024-06-27 收录
下载链接:
https://zenodo.org/record/8406322
下载链接
链接失效反馈
官方服务:
资源简介:
极端金属声乐数据集(EMVD)是由南特大学等研究机构创建的,专注于重金属音乐中的极端声乐技巧。该数据集包含760个音频片段,总时长约100分钟,涵盖了从1秒到30秒不等的录音,主要由27位不同歌手提供,未包含伴奏乐器或后期处理效果。数据集详细记录了四种不同的扭曲技巧和三种声乐效果,适用于音频处理领域的自动内容标签和实时声乐效果应用。创建过程中,研究者采用了移动录音设备,确保了数据集的多样性和实用性。该数据集旨在解决重金属音乐中声乐技巧分类的问题,推动声乐扭曲生成算法的发展。

The Extreme Metal Vocal Dataset (EMVD) was developed by research institutions including the University of Nantes, focusing on extreme vocal techniques in heavy metal music. This dataset contains 760 audio clips with a total duration of approximately 100 minutes, covering recordings ranging from 1 second to 30 seconds. These clips are primarily provided by 27 distinct vocalists, and no accompanying instruments or post-processing effects are included. The dataset comprehensively documents four distinct distortion techniques and three vocal effects, making it suitable for automatic content tagging and real-time vocal effect applications in the field of audio processing. During the dataset construction, researchers adopted mobile recording equipment to ensure its diversity and practicality. This dataset aims to address the problem of vocal technique classification in heavy metal music, and promote the development of vocal distortion generation algorithms.
提供机构:
南特大学, 中央理工-高等电力学院 CNRS, LS2N, UMR 6004 南特, 法国
创建时间:
2024-06-24
搜集汇总
数据集介绍
main_image_url
构建方式
极端金属声乐数据集(EMVD)的构建采取移动录音设备,以收录尽可能多的歌手。使用SM58麦克风进行录音,该麦克风在金属乐现场表演中广受欢迎。每位歌手需演唱三个元音[a]、[i]、[u],并维持一致的音调。随后,歌手使用自选歌词表演每种声乐技术约15秒。所有技术均在不同音域录制,除Grind Inhale技术外,每种技术均由超过15名歌手演唱。数据集包含760个音频文件,约100分钟音频材料,其中约60分钟为扭曲声音,40分钟为清晰声音。
特点
EMVD数据集的特点在于其涵盖了四种不同的扭曲技术和三种声乐效果,且所有录音均无伴奏音乐或后期处理效果。数据集的多样性体现在27位不同歌手的参与,以及四种扭曲技术在三个不同音域的展现。此外,该数据集是迄今为止最大的极端金属声乐数据集。
使用方法
使用EMVD数据集时,研究者可以将其作为训练资源,以帮助歌手提高技艺,同时也可以用于进一步理解和利用极端金属声乐。在音频处理研究领域,该数据集可用于探索新的研究方向,如技术识别用于自动标注和实时声乐效果处理。
背景与挑战
背景概述
极端金属声乐数据集(EMVD)是一项专注于重金属音乐中极端声乐技术的综合数据集。该数据集由Modan Tailleur等研究人员于近期创建,旨在为音频处理领域提供一种全新的资源,以促进对极端金属声乐技术的理解和应用。EMVD包含760个音频片段,涵盖了60分钟的扭曲声音和40分钟的清晰声音录音,由27位不同歌手演绎。该数据集的核心研究问题是分析和分类极端金属音乐中的声乐技术,对于相关领域如自动内容标签、实时声乐效果处理等具有潜在的应用价值。
当前挑战
在构建EMVD数据集的过程中,研究人员面临了多项挑战。首先,极端声乐技术种类繁多,且每个歌手的演绎方式存在差异,导致分类任务复杂化。其次,数据集构建过程中,如何保证音频质量以及分类的准确性是一大挑战。此外,由于数据集规模较大,对计算资源和存储资源的要求也较高。在研究领域问题上,如何有效区分不同声乐技术,特别是在音质和演唱方式高度相似的情况下,是当前面临的主要挑战。
常用场景
经典使用场景
极端金属声乐数据集(EMVD)的最经典使用场景在于对极端金属音乐中的声乐技巧进行分类研究。该数据集包含760个音频片段,涵盖了四种不同的声乐技巧和三种声乐效果,能够为研究者提供一个全面而多样的研究材料,以探究和分析这些独特的声乐表现手法。
实际应用
在实际应用中,EMVD数据集可以被用来训练机器学习模型,以实现对极端金属声乐的自动分类和识别,从而应用于音乐流媒体平台的自动标签标注或提升现场表演中的声乐效果。此外,它还可以推动声音失真生成算法的发展。
衍生相关工作
基于EMVD数据集,已经衍生出了一系列相关工作,包括对声乐技巧的自动检测、分类,以及基于深度学习算法的声乐效果生成研究等,这些研究进一步拓展了数据集的应用范围,推动了音频处理技术的进步。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务