five

ccmusic-database/Guzheng_Tech99|古筝演奏数据集|音频分析数据集

收藏
hugging_face2025-02-16 更新2024-03-04 收录
古筝演奏
音频分析
下载链接:
https://hf-mirror.com/datasets/ccmusic-database/Guzheng_Tech99
下载链接
链接失效反馈
资源简介:
Guzheng Technique 99数据集包含99首由专业音乐家在录音室环境中录制的古筝独奏曲目,总时长为9064.6秒。每首曲目都进行了详细的音符标注,包括音符的开始时间、结束时间、音高和演奏技巧。数据集共包含63,352个标注标签,涵盖了七种演奏技巧。数据集分为训练集、验证集和测试集,分别包含79、10和10首曲目。此外,数据集还提供了音频的频谱图,用于帧级古筝演奏技巧检测。

The Guzheng Technique 99 Dataset encompasses 99 solo compositions for guzheng, recorded by professional musicians within a studio environment, amounting to a cumulative duration of 9,064.6 seconds. Each composition is annotated for every note, indicating the onset, offset, pitch, and playing techniques, resulting in a total of 63,352 annotated labels across the dataset. The dataset is divided into training, validation, and test sets, containing 79, 10, and 10 songs, respectively. Additionally, the dataset provides spectrograms of the audio for frame-level guzheng playing technique detection.
提供机构:
ccmusic-database
原始信息汇总

古筝技巧99数据集概述

数据集描述

  • 数据集名称: Guzheng Technique 99 Dataset
  • 语言: 中文, 英文
  • 标签: 音乐, 艺术
  • 任务类别: 音频分类
  • 大小类别: n<1K

数据集摘要

该数据集包含99首古筝独奏作品,由专业音乐家在录音室环境中录制,总时长为9,064.6秒。每首作品的每个音符都进行了详细标注,包括起始时间、结束时间、音高和演奏技巧。标注的演奏技巧包括颤音、拨弦、上滑音、下滑音、滑奏/刮奏/连抹/连拖、摇指和点音。这些细致的标注总共产生了63,352个标注标签。该数据集与之前的GZ IsoTech数据集不同,此数据集在整个录音的音符级别进行了标注,而前一个数据集是在每个音频片段上进行标注。

数据集结构

原始子集

音频(.wav, 22050Hz) 梅尔(.jpg, 22050Hz) 标签
<audio controls src="https://huggingface.co/datasets/ccmusic-database/Guzheng_Tech99/resolve/main/data/31.flac"> <img src="./data/31.jpg"> {起始时间 : float64, 结束时间 : float, IPT : 7类, 音符 : int8}
... ... ...

评估子集

数据(logCQT频谱图) 标签
float64, 88 x 258 x 1 float64, 7 x 258

数据字段

数据集包含99首古筝独奏作品,由专业人士在录音室录制,总时长为9064.6秒。每首作品的每个音符都标注了七种演奏技巧(起始时间、结束时间、音高、颤音、点音、上滑音、下滑音、拨弦、滑奏和颤音),共产生了63,352个标注标签。数据集分为79首用于训练,10首用于验证,10首用于测试。

数据分割

训练集, 验证集, 测试集

数据集创建

策划理由

乐器演奏技巧(IPT)是音乐表演的关键元素。

源数据

初始数据收集和规范化

Dichucheng Li, Monan Zhou

源语言生产者

FD-LAMT的学生

标注

标注过程

古筝是一种多声部乐器。在古筝表演中,具有不同IPT的音符通常是重叠和混合的,可以分解为多个独立IPT的混合IPT通常被使用。大多数现有的IPT检测工作通常使用单声部乐器独奏片段的数据集。该数据集填补了研究领域的空白。

标注者

FD-LAMT的学生

使用数据集的考虑

社会影响

促进音乐AI产业的发展

偏见讨论

仅适用于传统中国乐器

其他已知限制

样本不足

附加信息

数据集策展人

Dichucheng Li

评估

Dichucheng Li, Mingjin Che, Wenwu Meng, Yulun Wu, Yi Yu, Fan Xia and Wei Li. "Frame-Level Multi-Label Playing Technique Detection Using Multi-Scale Network and Self-Attention Mechanism", in IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2023).

许可信息

MIT许可证

引用信息

bibtex @dataset{zhaorui_liu_2021_5676893, author = {Monan Zhou, Shenyang Xu, Zhaorui Liu, Zhaowen Wang, Feng Yu, Wei Li and Baoqiang Han}, title = {CCMusic: an Open and Diverse Database for Chinese and General Music Information Retrieval Research}, month = {mar}, year = {2024}, publisher = {HuggingFace}, version = {1.2}, url = {https://huggingface.co/ccmusic-database} }

贡献

促进音乐AI产业的发展

AI搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自[Guzheng_Tech99](https://ccmusic-database.github.io/en/database/csmtd.html#Tech99),包含99首古筝独奏作品,由专业音乐家在录音室环境中录制,总时长为9,064.6秒。每首作品的每个音符都经过详细标注,包括起始时间、结束时间、音高和演奏技巧,如颤音、拨弦、滑音等,共计63,352个标注标签。基于原始数据,进行了数据处理,构建了当前集成的默认子集,并通过[viewer](https://www.modelscope.cn/datasets/ccmusic-database/Guzheng_Tech99/dataPeview)查看其数据结构。此外,根据已发表文章中的评估过程,每个音频片段被处理为3秒的片段,采样率为44,100Hz,并转换为对数常数Q变换(CQT)频谱图,形成评估子集。
特点
该数据集的显著特点在于其详细的音符级标注,涵盖了多种古筝演奏技巧,如颤音、拨弦、滑音等,共计7种技巧。每个音符的标注包括起始时间、结束时间、音高和具体的演奏技巧,形成了一个包含63,352个标注标签的丰富数据集。此外,数据集已被划分为训练、验证和测试集,分别为79、10和10首歌曲,便于模型训练和评估。
使用方法
使用该数据集时,可以通过HuggingFace的`datasets`库加载数据。对于默认子集,使用`load_dataset`函数并指定`name='default'`和`split='train'`来加载训练数据。对于评估子集,同样使用`load_dataset`函数,但指定`name='eval'`,并分别加载训练、验证和测试集。数据集适用于帧级古筝演奏技巧检测任务,支持音频分类和音乐信息检索(MIR)等任务。
背景与挑战
背景概述
古筝技巧99数据集(Guzheng Technique 99 Dataset)是由专业音乐家在录音室环境中录制的99首古筝独奏曲目组成,总时长为9,064.6秒。该数据集由Dichucheng Li和Monan Zhou等研究人员创建,旨在填补现有乐器演奏技巧(IPT)检测数据集的空白,特别是针对多声部乐器如古筝的演奏技巧标注。每首曲目均详细标注了每个音符的开始时间、结束时间、音高及多种演奏技巧,如颤音、拨弦、滑音等,总计63,352个标注标签。该数据集的构建不仅为音乐信息检索(MIR)领域提供了宝贵的资源,还为音频分类任务提供了丰富的训练数据,推动了音乐人工智能行业的发展。
当前挑战
古筝技巧99数据集在构建过程中面临多项挑战。首先,古筝作为一种多声部乐器,其演奏技巧复杂且常出现重叠,导致标注过程极为复杂。其次,数据集的构建需要专业音乐家在录音室环境中进行高质量的录音,确保音频数据的准确性和一致性。此外,数据集的处理和特征提取也面临技术挑战,如将音频片段转换为对数常数Q变换(CQT)频谱图,并确保标注与音频数据的时间对齐。最后,数据集的样本量相对较小,可能限制其在某些深度学习模型中的应用效果。
常用场景
经典使用场景
Guzheng Technique 99 Dataset 的经典使用场景主要集中在古筝演奏技术的自动识别与分类。该数据集通过详细的标注,涵盖了古筝演奏中的多种技术,如颤音、拨弦、滑音等,为音频分类任务提供了丰富的训练数据。研究者可以利用这些数据训练模型,实现对古筝演奏技术的帧级检测,从而推动音乐信息检索(MIR)领域的发展。
解决学术问题
该数据集解决了传统音乐信息检索领域中,缺乏针对古筝演奏技术的详细标注数据的问题。通过提供高精度的演奏技术标注,研究者能够更准确地识别和分类古筝演奏中的复杂技术,推动了多标签演奏技术检测的研究进展。这对于提升音乐AI系统的性能和应用范围具有重要意义。
衍生相关工作
基于 Guzheng Technique 99 Dataset,研究者已开展了多项相关工作,包括多尺度网络与自注意力机制在演奏技术检测中的应用。这些研究在IEEE国际声学、语音与信号处理会议(ICASSP 2023)上得到了展示,进一步推动了音乐AI技术的发展。此外,该数据集还为其他传统乐器的演奏技术检测研究提供了参考和借鉴。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
5,000+
优质数据集
54 个
任务类型
进入经典数据集