five

CCOM-HuQin

收藏
arXiv2023-10-09 更新2024-06-21 收录
下载链接:
https://doi.org/10.5281/zenodo.6957454
下载链接
链接失效反馈
官方服务:
资源简介:
CCOM-HuQin是一个包含11,992个单个演奏技术片段和57个经典乐曲片段的多模态中国胡琴表演数据集,由中央音乐学院创建。该数据集涵盖了八种代表性的胡琴类别,由专业胡琴演奏家演奏。数据集不仅包括音频和视频记录,还提供了详细的演奏技术分类和注释,旨在支持音乐信息检索任务,如音高分析、自动转录和乐谱-音频对齐,以及跨文化音乐研究。

CCOM-HuQin is a multimodal Chinese huqin performance dataset created by the Central Conservatory of Music, which contains 11,992 single performance technique segments and 57 classic musical piece segments. This dataset covers eight representative categories of huqin, with performances delivered by professional huqin players. Besides audio and video recordings, it also provides detailed performance technique classifications and annotations, aiming to support music information retrieval tasks including pitch analysis, automatic transcription, score-audio alignment, as well as cross-cultural music research.
提供机构:
中央音乐学院
创建时间:
2022-09-14
搜集汇总
数据集介绍
main_image_url
构建方式
在民族音乐学与音乐信息检索的交叉领域,CCOM-HuQin数据集的构建体现了系统化与专业化的设计理念。该数据集由中央音乐学院的专业胡琴演奏家参与录制,涵盖了二胡、板胡、高胡、坠胡及中胡等八类代表性胡琴乐器。构建过程分为两个子集:一是针对12类演奏技法(包括8种弓法与4种指法)的单技法片段,通过设定不同速度、力度与音程参数以覆盖实际演奏中的多样性;二是57段古典乐曲选段,每段均配备多视角高清视频与高质量音频。录制采用专业设备,如DPA 4011麦克风与索尼X9摄像机,并通过打板器实现音视频同步。数据后期处理包括音视频对齐、片段分割及人工标注,确保了数据的完整性与一致性。
特点
CCOM-HuQin数据集的核心特点在于其多模态性与精细标注。作为首个针对胡琴音乐的多模态表演数据集,它集成了音频、视频(多视角)、乐谱(PDF与MusicXML格式)及转录文件(CSV格式),为跨模态研究提供了丰富素材。数据集突出强调了胡琴演奏技法的复杂性,涵盖颤弓、垫弓、滑音、揉弦等12类技法,其中部分技法进一步细分子类,如滑音分为上滑音、下滑音等。标注工作基于专业演奏家的验证,采用BIE(起始-中间-结束)模式对连续技法进行序列标注,确保了音乐表达的准确性。此外,数据集规模显著,包含11,992个单技法片段与总时长77分钟的乐曲选段,在多样性与覆盖范围上超越了现有同类资源。
使用方法
该数据集为音乐信息检索与民族音乐学研究提供了多维度的应用场景。在基础MIR任务中,其精细的音高标注与技法标签可用于音高检测、自动记谱及乐谱-音频对齐等算法的训练与评估。对于演奏技法分析,研究者可结合音频特征(如梅尔频谱)与视频中的手部姿态数据(通过MediaPipe提取),开发跨模态的技法识别模型。此外,数据集支持文化比较研究,例如通过对比胡琴与西洋提琴的技法统计,探索不同音乐传统中的表达差异。用户可通过Zenodo平台申请访问数据集,并参考附带的详细文档与示例代码,以开展相关实验。数据集的设计兼顾了可扩展性,未来可进一步纳入更多乐器类型与演奏风格。
背景与挑战
背景概述
胡琴作为中国传统弓弦乐器家族,承载着千余年的音乐文化积淀,其演奏技法在音乐表达中具有独特的美学价值。CCOM-HuQin数据集由中央音乐学院与清华大学的研究团队于2023年联合创建,旨在填补民族乐器多模态数据资源的空白。该数据集聚焦于胡琴演奏技法的系统化标注,涵盖二胡、板胡、高胡等八类代表性乐器,收录了11,992个单技法片段与57首经典乐曲的多视角音视频记录。其核心研究问题在于解决民族乐器音乐信息检索中因标注数据稀缺导致的技术瓶颈,为音高分析、自动记谱等基础任务提供标准化基准。该数据集的建立不仅推动了计算音乐学在传统文化领域的应用,也为跨文化音乐比较研究提供了珍贵素材。
当前挑战
在音乐信息检索领域,胡琴音乐因丰富的演奏技法而构成独特挑战:连续滑音与颤音等技法导致音高轨迹非线性变化,传统自动记谱算法在此类复杂声学场景中准确率显著下降;多技法混合演奏时边界模糊性增加,为音符层级标注带来语义分割难题。数据集构建过程中面临双重困难:一方面,现有自动音符检测工具对胡琴技法适应性不足,超过半数音符需依赖专业乐手人工校正,标注流程耗时且依赖领域知识;另一方面,演奏技法标注需建立跨模态对齐体系,视频中的手势运动与音频中的声学特征需在时间维度精确匹配,这对多机位同步录制与后期处理提出了严苛技术要求。
常用场景
经典使用场景
在音乐信息检索领域,CCOM-HuQin数据集为研究中国传统弓弦乐器——胡琴的演奏技术提供了关键资源。该数据集通过包含11,992个单演奏技术片段和57段标注的古典乐曲摘录,为分析胡琴演奏中的弓法与指法技术奠定了数据基础。其多模态特性,结合高质量音频与多视角视频,使得研究者能够深入探究演奏技术的声学特征与视觉表现之间的关联,从而推动演奏风格识别与音乐情感分析的研究。
衍生相关工作
基于CCOM-HuQin数据集,已衍生出多项经典研究工作,主要集中在演奏技术自动识别与多模态分析方向。例如,研究者利用该数据集训练卷积循环神经网络模型,实现了胡琴演奏技术的高精度分类;同时,结合手部姿态检测与音频特征,开发了跨模态的演奏风格建模方法。这些工作不仅验证了数据集的实用价值,还为胡琴音乐的智能化分析与合成开辟了新路径,促进了音乐科技与传统艺术的深度融合。
数据集最近研究
最新研究方向
在音乐信息检索领域,CCOM-HuQin数据集作为首个多模态胡琴演奏数据集,正推动着传统民族乐器研究的深度发展。该数据集通过系统标注的演奏技法,为音频-视觉联合分析提供了丰富资源,促进了演奏技法识别、音高估计和自动记谱等基础任务的算法优化。前沿研究聚焦于跨模态学习,利用对齐的音频、视频和乐谱数据,探索演奏者手势与音乐表达的关联,以及基于生成模型的表演视频合成。此外,数据集在跨文化音乐比较研究中展现出潜力,例如通过对比胡琴与小提琴的演奏技法差异,揭示不同音乐传统中的表达特征。这些进展不仅提升了民族音乐的计算分析水平,也为文化遗产的数字化保存与创新应用奠定了技术基础。
相关研究论文
  • 1
    CCOM-HuQin: an Annotated Multimodal Chinese Fiddle Performance Dataset中央音乐学院 · 2023年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作