five

ADTOF

收藏
arXiv2021-11-23 更新2024-06-21 收录
下载链接:
https://github.com/MZehren/ADTOF
下载链接
链接失效反馈
官方服务:
资源简介:
ADTOF是由于默奥大学的研究团队创建的一个大型非合成音乐自动鼓谱转录数据集。该数据集包含114条真实世界的音乐数据,远超其他非合成数据集的规模。数据来源于节奏游戏社区的众包注释,这些注释与现有ADT数据集的内容相似,包含音频源和鼓上播放的音符表示。创建过程中,研究团队通过自动校正不同类型的错误来提高数据集质量。ADTOF主要应用于自动鼓谱转录领域,旨在解决现有数据集在大小和真实性上的不足,提供更高质量的训练数据。

ADTOF is a large-scale non-synthetic automatic drum transcription dataset created by a research team from Umeå University. This dataset contains 114 pieces of real-world musical data, which far exceeds the scale of other non-synthetic datasets. The data is sourced from crowdsourced annotations in the rhythm game community. These annotations are similar in content to existing ADT datasets, and include audio sources and note representations of drum performances. During the dataset creation process, the research team improved the dataset quality by automatically correcting various types of errors. ADTOF is primarily applied in the field of automatic drum transcription, aiming to address the shortcomings of existing datasets in terms of scale and authenticity, and provide higher-quality training data.
提供机构:
于默奥大学
创建时间:
2021-11-23
搜集汇总
数据集介绍
main_image_url
构建方式
在自动鼓转录研究领域,高质量标注数据的稀缺长期制约着模型性能的提升。ADTOF数据集的构建创新性地利用了节奏游戏社区中玩家创作的海量自定义谱面,这些谱面包含真实音乐音频与鼓点标注。研究团队从Rhythm Gaming World平台筛选了1700首高评分“专业鼓谱”曲目,通过开源工具将其转换为标准格式,并开发了系统的数据清洗流程以提升标注质量。
特点
ADTOF数据集的核心特征在于其规模与真实性实现了突破性平衡。该数据集包含超过114小时的真实世界音乐录音,规模比现有非合成数据集大两个数量级,同时涵盖五种鼓类乐器标注。数据来源于多样化的真实音乐曲目,虽在流派分布上偏向摇滚乐,但避免了合成音频的声学失真,为模型训练提供了更接近实际应用场景的数据基础。
使用方法
该数据集可直接用于训练和评估鼓转录模型。研究实践表明,使用ADTOF单独训练卷积循环神经网络(CRNN)模型,即可达到与当前最优方法相当的性能水平。在具体应用中,可将数据集按艺术家非重叠原则划分为十个子集,采用交叉验证策略进行模型训练与测试,输出层可对应五种鼓类的激活概率,最终通过峰值检测算法转换为符号化鼓谱表示。
背景与挑战
背景概述
在音乐信息检索领域,自动鼓点转录技术旨在从包含旋律乐器的多音轨音乐中提取鼓点的符号化表示,这一任务因音频的复杂性和标注数据的稀缺而颇具挑战。ADTOF数据集由乌默奥大学和埃菲特大学的研究团队于2021年构建,其核心目标在于解决现有数据集在规模与真实性之间的权衡困境。通过挖掘节奏游戏社区中玩家共享的大量标注数据,该数据集汇集了超过114小时的真实音乐录音,并涵盖五类鼓乐器,显著提升了训练数据的体量与真实性,为基于深度学习的鼓点转录模型提供了更为优质的资源,推动了该领域向更高效、更准确的转录方法迈进。
当前挑战
ADTOF数据集面临的挑战主要体现在领域问题与构建过程两方面。在领域层面,鼓点转录需在复杂多变的音乐背景下精确识别并时序定位各类鼓乐器,尤其当鼓声与旋律乐器交织时,信号分离与事件检测的难度显著增加,且数据中鼓类分布的不均衡性进一步影响了模型的泛化能力。在构建过程中,由于标注来源于众包,初始数据存在时间对齐偏差与标签不一致性问题,例如标注点与实际鼓点onset之间存在可达50毫秒的偏移,以及游戏控制器映射导致的乐器类别模糊,研究团队需通过自动对齐技术与类别归并策略进行数据清洗,以确保标注质量满足模型训练需求。
常用场景
经典使用场景
在音乐信息检索领域,自动鼓点转录技术旨在从包含旋律乐器的多音轨音乐中提取鼓点符号表示。ADTOF数据集以其大规模非合成音乐标注特性,成为训练深度神经网络模型的经典资源。研究者常利用该数据集构建卷积循环神经网络等先进架构,通过监督学习方式优化鼓点检测的时序精度与乐器分类性能,显著提升了复杂音乐环境下鼓点转录的鲁棒性与泛化能力。
衍生相关工作
ADTOF的发布催生了面向众包音乐标注质量优化的系列研究,如基于贝叶斯推断的标注误差校正框架。在模型架构层面,研究者受其大规模数据启发,开发了融合注意力机制的跨模态鼓点检测网络。数据集构建方法论亦衍生出针对其他乐器的众包标注管道研究,而其对真实音乐分布的强调,进一步推动了音乐合成领域面向物理建模的数据增强技术发展,形成从数据采集到模型部署的完整技术生态。
数据集最近研究
最新研究方向
在音乐信息检索领域,自动鼓转录技术长期面临高质量标注数据稀缺的挑战。ADTOF数据集通过整合节奏游戏社区的海量众包标注,为真实音乐环境下的鼓转录研究提供了前所未有的数据规模。当前前沿研究聚焦于利用此类非合成数据优化深度学习模型的训练流程,探索数据自动清洗与对齐技术以提升标注精度,并推动模型在复杂多乐器混音场景中的泛化能力。该数据集的引入不仅促进了鼓转录算法性能的显著提升,还激发了跨社区数据协作的新范式,对音乐分析、游戏交互及教育应用产生深远影响。
相关研究论文
  • 1
    ADTOF: A large dataset of non-synthetic music for automatic drum transcription于默奥大学 · 2021年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作