five

Acoustic Plectrum Guitar Dataset

收藏
arXiv2024-08-27 更新2024-08-29 收录
下载链接:
http://arxiv.org/abs/2408.14890v1
下载链接
链接失效反馈
官方服务:
资源简介:
本数据集名为‘Acoustic Plectrum Guitar Dataset’,由斯里西瓦萨巴拉米亚纳达尔工程学院创建,专注于自动音乐转录(AMT)任务。数据集包含216个波形文件,每个文件记录了使用声学拨片吉他演奏的音符序列。数据集的创建过程结合了预定义的吉他练习和基于隐马尔可夫模型(HMM)的强制Viterbi对齐技术,确保了音符转录的时间精确性。该数据集主要用于训练机器学习系统,特别是神经网络,以实现对单音吉他独奏表演的自动转录,旨在解决音乐数据集的准确性和效率问题。

Named 'Acoustic Plectrum Guitar Dataset', this dataset was developed by Sri Sivasubramaniya Nadar College of Engineering, targeting the Automatic Music Transcription (AMT) task. It consists of 216 waveform files, each documenting a sequence of musical notes performed on an acoustic plectrum guitar. The dataset creation workflow integrates predefined guitar exercises and a forced Viterbi alignment technique based on the Hidden Markov Model (HMM), ensuring the temporal accuracy of note transcription. This dataset is primarily used for training machine learning systems, particularly neural networks, to achieve automatic transcription of monophonic guitar solo performances, aiming to address the accuracy and efficiency issues in music datasets.
提供机构:
斯里西瓦萨巴拉米亚纳达尔工程学院
创建时间:
2024-08-27
搜集汇总
数据集介绍
main_image_url
构建方式
该数据集的构建方式是通过预定义吉他练习曲的音符序列,使用这些序列录制音频,然后采用基于HMM的强制Viterbi对齐方法进行时间对齐和标注。具体来说,选取吉他上的特定弦,确定覆盖前四个/五个品格的音符序列,多次录制这些序列的音频,对部分音频文件进行手动标注,建立HMM模型,并用这些模型对剩余的音频文件进行时间对齐。
特点
该数据集的特点包括:1) 采用真实乐器录制,保持了乐器的音色特征;2) 通过预定义的音符序列和HMM模型,实现了高效的数据集构建;3) 注释精度高,平均误差在5ms以内;4) 数据集可扩展,可通过重复过程来增加更复杂的音符序列和更高的品格。
使用方法
使用该数据集的方法包括:1) 使用已构建的HMM模型对新的音频文件进行时间对齐和标注;2) 可以通过增加更多的音符序列和品格来扩展数据集,以用于训练更复杂的模型;3) 数据集提供的精确标注可以用于自动音乐转录系统的开发和评估。
背景与挑战
背景概述
Acoustic Plectrum Guitar Dataset是由S. Johanan Joysingh、P. Vijayalakshmi和T. Nagarajan于2024年8月27日发表在arXiv上的一个音乐数据集。该数据集的创建旨在为自动音乐转录(AUTOMATIC MUSIC TRANSCRIPTION, AMT)任务提供一个大型注解音乐数据集。考虑到音乐数据集的构建需要大量具有音乐经验的人力和时间,研究者提出了一种基于隐马尔可夫模型(HMM)的强制Viterbi对齐方法,以简化数据集的生成过程。该数据集的核心研究问题是开发一个高效的框架,用于生成任何乐器的数据集,特别是单声部的乐器,如木管乐器和弓弦乐器。
当前挑战
该数据集在构建过程中遇到的挑战主要包括:1)所解决的领域问题是自动音乐转录,特别是在单声部乐器上的应用;2)构建过程中需要克服的挑战包括:确保数据集的泛化能力、效率、成本和质量。具体来说,挑战包括:a)数据集的泛化能力,即包含真实世界乐器的良好表示;b)效率,即快速且易于收集,需要较少的领域知识,且不费力;c)成本,即录制和注解数据集的时间和金钱成本不能过高;d)质量,即录制的音频质量和注解的准确性不能妥协。
常用场景
经典使用场景
该数据集的经典使用场景在于自动音乐转录(Automatic Music Transcription, AMT)任务中,特别是针对拨弦吉他独奏表演的转录。通过使用预定义的吉他练习曲,结合隐马尔可夫模型(HMM)基于强制Viterbi对齐技术,研究人员能够获得时间对齐的转录,这对于训练机器学习模型以实现自动音乐转录至关重要。
实际应用
在实际应用中,该数据集可以用于训练和测试自动音乐转录系统,从而实现对拨弦吉他独奏表演的自动转录。此外,该数据集的创建方法也可以应用于其他乐器的数据集创建,推动自动音乐转录技术在更多乐器领域的研究和应用。
衍生相关工作
该数据集的创建方法衍生出了一系列相关工作,包括但不限于针对不同乐器的数据集创建、基于该数据集的自动音乐转录算法研究、以及音乐信息检索领域的应用研究等。这些工作进一步扩展了该数据集的应用范围和影响力。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作