five

OrchideaSOL

收藏
arXiv2020-07-02 更新2024-06-21 收录
下载链接:
https://forum.ircam.fr/
下载链接
链接失效反馈
官方服务:
资源简介:
OrchideaSOL是由加州大学伯克利分校CNMAT开发的一个免费数据集,包含扩展乐器演奏技巧的样本,旨在作为Orchidea框架的默认数据集,用于目标导向的计算机辅助编曲。该数据集是从1996年至1998年在Ircam开发的Studio On Line(SOL)数据集中提取并修改的子集。OrchideaSOL通过清理和修剪原始录音,重新采样为44.1kHz,并使用最清晰的第三通道(近场麦克风)录音,以避免动态范围的损失。数据集包含丰富的演奏技巧,如ordinario、sforzati、人工泛音等,适用于音乐认知、音乐信息检索和声音合成生成模型的科学研究。

OrchideaSOL is a free dataset developed by CNMAT, the Center for New Music and Audio Technologies at the University of California, Berkeley. It contains samples of extended instrumental performance techniques, and is designed as the default dataset for the Orchidea framework for goal-oriented computer-aided music arrangement. This dataset is a curated subset extracted and modified from the Studio On Line (SOL) dataset developed at IRCAM between 1996 and 1998. To avoid loss of dynamic range, OrchideaSOL cleans and trims the original recordings, resamples them to 44.1 kHz, and adopts the clearest third-channel (near-field microphone) recordings. The dataset covers a wide range of performance techniques, including ordinario, sforzati, artificial harmonics, and others, and is applicable to scientific research in music cognition, music information retrieval, and generative models for sound synthesis.
提供机构:
加州大学伯克利分校CNMAT
创建时间:
2020-07-02
搜集汇总
数据集介绍
main_image_url
构建方式
在计算机辅助配器领域,高质量且一致的音频数据集对于生成逼真的管弦乐编排至关重要。OrchideaSOL的构建源于对原始Studio On Line(SOL)数据集的深度重构与优化。该数据集选取了SOL中约35%的演奏技法样本,总计12253个音频文件,并专注于扩展演奏技法。构建过程包括对原始六声道录音进行精选,仅保留第三通道(近距离麦克风)的单声道音频,以规避后续版本中因归一化处理导致的动态范围失真。随后,团队实施了音高校准、音量补偿、缺失音高插值以及文件命名规范化等一系列处理步骤,旨在恢复乐器家族间自然的动态关系,并确保音频质量与元数据的一致性。
特点
OrchideaSOL的核心特点在于其专注于扩展演奏技法,涵盖了诸如人工泛音、弹拨、气声、铜管音色、阻塞音等二十余种非传统演奏方式,为现代音乐创作与计算音乐学研究提供了丰富的音色素材。数据集经过精细的音量与动态范围校准,力求还原真实乐器在强弱变化中的自然响度比例,从而提升了计算机辅助配器系统在现实场景中的实用性。此外,所有样本在起始时间、基频和响度级别上均经过对齐处理,并附带了详尽的元数据与预计算声学特征(如MFCC、频谱包络等),为音乐信息检索、乐器分类及听觉认知研究提供了高度结构化的实验平台。
使用方法
OrchideaSOL主要作为Orchidea计算机辅助配器框架的默认数据集,用于帮助作曲家寻找匹配目标声音的管弦乐音色组合。用户可通过目标声音输入,系统自动在数据集中搜索并推荐相似的乐器组合,生成可排版的乐谱。在科研领域,该数据集适用于音乐信息检索任务,如乐器识别、演奏技法分类及基频估计。研究者可利用其提供的标准化元数据、预分割的数据折以及丰富的声学特征,快速构建和评估机器学习模型。数据集通过Ircam论坛分发,并附有Python工具支持,确保数据的可重现性与易用性。
背景与挑战
背景概述
在计算机辅助管弦乐配器领域,OrchideaSOL数据集作为一项关键资源,于2020年由加州大学伯克利分校的Carmine Emanuele Cella、Daniele Ghisi及纽约大学的Vincent Lostanlen等学者联合推出。该数据集源自1996年至1998年间由法国声学与音乐研究中心开发的Studio On Line项目,旨在为基于目标的计算机辅助管弦乐系统提供高质量的扩展演奏技法音频样本。其核心研究问题聚焦于通过精确的音频数据建模,解决传统管弦乐配器中声音组合匹配的复杂性,从而提升自动化配器系统的实用性与艺术表现力。OrchideaSOL不仅优化了原始数据的动态范围与一致性,还为音乐信息检索、认知科学研究及生成式声音合成提供了标准化测试平台,显著推动了计算音乐学与人工智能在艺术创作中的交叉应用。
当前挑战
OrchideaSOL数据集所针对的领域挑战在于计算机辅助管弦乐配器中的声音匹配精度问题。传统方法常因音频样本的动态范围失真或乐器家族间音量关系不一致,导致生成的配器方案在实际演奏场景中效果不佳。此外,扩展演奏技法(如人工泛音、弹拨技法等)的多样性与复杂性,增加了声音特征建模与分类的难度,要求数据集具备高度的音质一致性与语义标注准确性。在构建过程中,团队面临多重技术挑战:原始SOL数据存在音高失调、音量补偿不均及文件命名不规范等问题,需通过精细的音频重调、音量曲线分析与半自动脚本处理进行修正;同时,为保持录音条件的统一性,需从多通道原始录音中筛选最佳信号源,并手动校正异常样本,这一过程既耗时又需依赖专业音乐知识,凸显了高质量音乐数据集构建中技术严谨性与艺术感知平衡的复杂性。
常用场景
经典使用场景
在计算机辅助配器领域,OrchideaSOL数据集作为目标导向型配器框架Orchidea的默认数据集,其经典使用场景在于为作曲家提供丰富的扩展演奏技法音频样本,以支持算法寻找与目标声音相匹配的管弦乐组合。通过整合多种乐器的常规与特殊演奏技法,该数据集使系统能够生成具有高度真实感的配器方案,从而在数字音乐创作中模拟传统管弦乐队的声学特性。
衍生相关工作
基于OrchideaSOL衍生的经典工作包括Orchidea框架的持续优化,以及其在音乐信息检索领域的扩展应用。例如,研究团队利用该数据集开发了针对乐器与演奏技法的自动分类模型,并推动了Timbre建模算法的进步。此外,数据集的分支版本TinySOL与FullSOL也为不同规模的研究项目提供了适配资源,促进了开源社区在计算机音乐与声学分析方面的协作创新。
数据集最近研究
最新研究方向
在计算机辅助配器领域,OrchideaSOL数据集正推动着前沿研究向更精细化的声音建模与智能分析方向发展。该数据集通过恢复原始动态范围并优化音频样本的一致性,为基于目标的配器系统提供了更可靠的声学基础,从而促进了真实场景下配器解决方案的准确性。当前研究热点聚焦于利用该数据集进行乐器识别、演奏技巧分类及音高估计等音乐信息检索任务,同时其在音乐认知与生成式声音合成模型中的应用也备受关注。OrchideaSOL的发布不仅提升了计算机辅助作曲工具的实际效能,还为跨学科研究如机器学习与音乐感知的融合提供了标准化测试平台,具有重要的学术与实践意义。
相关研究论文
  • 1
    OrchideaSOL: a dataset of extended instrumental techniques for computer-aided orchestration加州大学伯克利分校CNMAT · 2020年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作