ccmusic-database/GZ_IsoTech
收藏GZ_IsoTech 数据集概述
数据集描述
GZ_IsoTech 数据集包含 2,824 个音频片段,展示了古筝演奏的各种技巧。具体来说,2,328 个片段来自虚拟音源库,496 个片段由一位专业的古筝艺术家演奏录制。这些录音涵盖了古筝乐器的全面音调范围。
数据集摘要
由于原始数据集已经按照大约 4:1 的比例划分了训练集和测试集,我们保持了原始的数据划分方法。与使用平台特定的自动分割机制不同,我们直接使用预先分割的数据进行后续的整合步骤。
支持的任务和排行榜
- 任务类别: 音乐信息检索(MIR),音频分类
语言
中文,英文
数据集结构
| 音频(.wav, 22050Hz) | mel(.jpg, 22050Hz) | 标签 | cname |
|---|---|---|---|
| <audio controls src="https://huggingface.co/datasets/ccmusic-database/GZ_IsoTech/resolve/main/data/record_chanyin1.wav"> | <img src="./data/record_chanyin1.jpg"> | 8-class | string |
| ... | ... | ... | ... |
数据实例
.zip(.flac, .csv)
数据字段
音频片段根据古筝的多种演奏技巧进行分类,分为八个类别:颤音(chanyin)、上滑音(shanghuayin)、下滑音(xiahuayin)、回滑音(huihuayin)、滑奏(guazou, huazhi)、颤音(yaozhi)、泛音(fanyin)、拨弦(gou, da, mo, tuo…)。
数据分割
训练集,测试集
数据集创建
创建理由
古筝是一种具有多种演奏技巧的中国传统乐器。乐器演奏技巧(IPT)在音乐表演中起着重要作用。然而,大多数现有的 IPT 检测工作对可变长度的音频效率较低,并且不能保证泛化能力,因为它们依赖于单一音源库进行训练和测试。在本研究中,我们提出了一种使用全卷积网络的端到端古筝演奏技巧检测系统,该系统可以应用于可变长度的音频。由于每种古筝演奏技巧都应用于一个音符,因此我们训练了一个专用的起始检测器,将音频分割成多个音符,并将预测结果与帧级 IPT 预测融合。在融合过程中,我们在每个音符内逐帧添加 IPT 预测,并获得每个音符内概率最高的 IPT 作为该音符的最终输出。我们创建了一个名为 GZ_IsoTech 的新数据集,该数据集来自多个音源库和现实世界的古筝演奏录音,用于古筝表演分析。我们的方法在帧级准确率上达到了 87.97%,在音符级 F1 分数上达到了 80.76%,大大超过了现有工作,这表明我们提出的方法在 IPT 检测中的有效性。
源数据
初始数据收集和规范化
Dichucheng Li, Monan Zhou
源语言生产者
FD-LAMT 的学生
注释
注释过程
该数据库包含 2,824 个古筝演奏技巧的音频片段。其中,2,328 个片段从虚拟音源库收集,496 个片段由一位专业的古筝演奏者演奏并录制。
注释者
FD-LAMT 的学生
个人信息和敏感信息
无
使用数据的考虑
数据集的社会影响
促进音乐人工智能产业的发展
偏见讨论
仅适用于中国传统乐器
其他已知限制
样本不足
附加信息
数据集策展人
Dichucheng Li
评估
许可信息
MIT License
引用信息
bibtex @dataset{zhaorui_liu_2021_5676893, author = {Monan Zhou, Shenyang Xu, Zhaorui Liu, Zhaowen Wang, Feng Yu, Wei Li and Baoqiang Han}, title = {CCMusic: an Open and Diverse Database for Chinese and General Music Information Retrieval Research}, month = {mar}, year = {2024}, publisher = {HuggingFace}, version = {1.2}, url = {https://huggingface.co/ccmusic-database} }
贡献
促进音乐人工智能产业的发展




