CloserMusicDB
收藏arXiv2024-10-25 更新2024-10-29 收录
下载链接:
https://github.com/closermusic/CloserMusicDB
下载链接
链接失效反馈官方服务:
资源简介:
CloserMusicDB是由Closer Music和华沙理工大学计算机科学研究所合作创建的高质量音乐数据集,包含106首专业录制的全长音乐曲目,总时长约5小时。数据集中的音频文件以无压缩的立体声WAV格式存储,采样率为44100 Hz,16位深度。数据集的创建过程包括由专家团队进行的人工注释,提供了钩子开始和结束的时间戳、BPM、音乐标签等元数据。该数据集主要用于音乐信息检索、机器学习和信号处理领域的研究,旨在解决钩子检测、上下文标签和艺术家识别等问题,推动音乐相关机器学习任务的发展。
CloserMusicDB is a high-quality music dataset co-created by Closer Music and the Institute of Computer Science, Warsaw University of Technology. It contains 106 professionally recorded full-length music tracks with a total duration of approximately 5 hours. All audio files in the dataset are stored in uncompressed stereo WAV format, with a sampling rate of 44100 Hz and 16-bit depth. The dataset was developed with manual annotations from a team of experts, providing metadata such as hook start and end timestamps, BPM, and music tags. This dataset is primarily intended for research in music information retrieval, machine learning and signal processing, aiming to address tasks including hook detection, contextual tagging and artist recognition, and advance the development of music-related machine learning tasks.
提供机构:
华沙理工大学计算机科学研究所
创建时间:
2024-10-25
原始信息汇总
CloserMusicDB
概述
CloserMusicDB 是一个由人类专家团队注释的全长录音室质量音轨集合。
数据集来源
数据集可在 Zenodo 上获取:https://zenodo.org/records/13868828。
许可协议
CloserMusicDB 根据 NC-RCL 许可证进行分发。
NC-RCL 许可证条款
- 非商业研究社区许可证 (NC-RCL)
- 限制性再分发:允许在任何媒介或格式中复制和使用提供的音频材料,前提是仅用于研究社区内的非商业目的,并且再分发仅限于通过 moises.ai 平台或其他明确授权的平台进行。未经许可人书面同意,不得在授权平台外进行再分发。
- 署名:必须给予适当的署名(包括艺术家的姓名和歌曲的标题),并提供指向此许可证的链接或注明此许可证的条款。
- 非商业使用:不得将材料用于任何商业目的或财务收益。这包括但不限于材料的销售、许可或租赁,以及任何主要目的是产生收入或利润的使用。
- 禁止衍生作品:除非艺术家明确许可,否则不得创建、混音、改编或基于材料进行构建。
- 保留法律声明:不得移除材料中包含或附带的任何版权或其他专有声明。
- 终止:如果您未能遵守此许可证,您使用材料的权利将自动终止。
- 语音克隆限制:禁止使用人声音轨或音频材料的任何部分创建艺术家的公开数字模仿(例如:语音克隆或复制品)。这包括但不限于使用语音合成技术、深度学习算法和其他基于人工智能的工具。
搜集汇总
数据集介绍

构建方式
CloserMusicDB数据集的构建基于一个由人类专家团队精心标注的高质量音乐库。该数据集包含了106首全长录音室质量的曲目,这些曲目均由专业人员录制、制作、混音和母带处理。音频文件以无压缩的立体声WAV格式存储,采样率为44100 Hz,位深度为16位。此外,数据集还提供了丰富的元数据,包括文件名、主要艺术家和客座艺术家标识符、钩子部分的开始和结束时间戳、每分钟节拍数(BPM)以及一组音乐标签。这些标签由专家手动标注,确保了数据的准确性和可靠性。
特点
CloserMusicDB数据集的显著特点在于其高质量的音频和详细的元数据标注。所有曲目均为专业录制,确保了音频的高保真度。数据集中的元数据不仅包括基本的音乐属性,如BPM和艺术家信息,还特别标注了钩子部分的开始和结束时间,以及与曲目相关的上下文标签。这些标签不仅涵盖了音乐的情感和风格,还扩展到了音乐的实际应用场景,如锻炼、旅行或作为视频背景音乐等。这种细致的标注使得该数据集在音乐信息检索、机器学习和信号处理等领域具有广泛的应用潜力。
使用方法
CloserMusicDB数据集适用于多种音乐相关的机器学习任务,如钩子检测、上下文标签和艺术家识别。对于钩子检测任务,研究人员可以利用数据集中提供的钩子时间戳,训练模型识别音乐中最显著和重复的段落。在上下文标签任务中,数据集的标签信息可以帮助构建更智能的音乐推荐系统,使推荐不仅基于音乐的听觉特征,还能考虑其适用的实际场景。艺术家识别任务则可以通过分析数据集中不同艺术家的音频样本,训练模型识别艺术家特有的音频模式和风格元素。研究人员可以通过访问Zenodo平台并填写相关表格,获取数据集的使用权限。
背景与挑战
背景概述
在音乐信息检索、机器学习和信号处理等领域,高质量的音乐音频数据集对于推动研究至关重要。然而,现有数据集的质量参差不齐,常因版权限制和高保真录音的获取难度而受到影响。这种不一致性可能影响研究结果的可重复性和泛化能力,凸显了构建更全面和高品质音乐数据集的必要性。CloserMusicDB数据集由Closer Music和华沙理工大学计算机科学研究所的团队创建,旨在提供高质量、符合版权的音乐数据,并辅以专家标注的元数据子集。该数据集不仅包含音频文件,还提供了钩子(hook)的开始和结束时间、相关标签以及艺术家标识符等元数据。通过确保数据的一致性和可访问性,CloserMusicDB旨在支持可重复的研究,并促进音乐相关机器学习任务的发展。
当前挑战
CloserMusicDB数据集在构建过程中面临多个挑战。首先,确保数据集中的音频质量达到工作室级别,同时符合版权要求,是一项复杂且耗时的任务。其次,钩子检测、上下文标签和艺术家识别等任务的标注需要专家团队的参与,以确保标注的准确性和一致性。此外,数据集的多样性和覆盖范围也是一个挑战,因为需要涵盖不同风格和类型的音乐,以支持广泛的机器学习任务。最后,数据集的发布和访问限制在非商业研究社区内,这可能限制了其在更广泛领域的应用和影响。
常用场景
经典使用场景
CloserMusicDB数据集在音乐信息检索领域中展现了其经典应用场景,特别是在钩子检测、上下文标签和艺术家识别等任务中。钩子检测任务通过识别歌曲中最引人注目的部分,帮助研究人员理解音乐结构和听众的注意力捕捉机制。上下文标签任务则通过为音乐添加描述性标签,如‘锻炼’或‘旅行’,增强了音乐推荐系统的实用性。艺术家识别任务利用数据集中多个艺术家作品的特征,训练模型识别和区分不同艺术家的独特风格。
解决学术问题
CloserMusicDB数据集解决了音乐信息检索领域中常见的学术问题,如数据集质量不一致和版权限制。通过提供高质量、版权合规的音乐数据,该数据集确保了研究结果的可重复性和泛化能力。此外,数据集中的专家标注和丰富的元数据支持了音乐相关机器学习任务的研究,推动了音乐信息检索技术的发展,填补了现有数据集的不足。
衍生相关工作
CloserMusicDB数据集的发布催生了一系列相关研究工作,特别是在音乐信息检索和机器学习领域。例如,基于该数据集的钩子检测技术已被应用于音乐结构分析和听众行为研究。上下文标签的研究扩展了音乐推荐系统的功能,使其能够更好地适应用户的多样化需求。艺术家识别技术的进展则推动了音乐版权保护和艺术家风格分析的研究,为音乐产业的数字化转型提供了技术支持。
以上内容由遇见数据集搜集并总结生成



