five

ccmusic-database/chest_falsetto

收藏
Hugging Face2026-02-27 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ccmusic-database/chest_falsetto
下载链接
链接失效反馈
官方服务:
资源简介:
原始数据集包含1280个单声道唱歌音频文件,格式为.wav,采样率为22,050 Hz,由中央音乐学院声乐专业的学生录制和注释。胸声标记为chest,假声标记为falsetto。此外,数据集还包括每个音频段的Mel频谱图、Mel频率倒谱系数(MFCC)和频谱特征,总共有5,120个CSV文件。原始数据集未区分男女声音,但通过手动审查添加了性别注释。除了原始内容外,还提供了评估期间的预处理版本,详细内容见第IV节。这种方法也应用于尚未评估的两个后续分类数据集:音乐流派数据集、美声唱法与中国民族唱法数据集。
提供机构:
ccmusic-database
原始信息汇总

数据集概述

名称: Chest voice and Falsetto Dataset 描述: 该数据集包含1,280个单声道歌唱音频文件,格式为.wav,采样率为22,050 Hz,由中央音乐学院声乐专业的学生演唱、录制并标注。音频文件分为胸声和假声两类,分别标记为_chest_和_falsetto_。此外,数据集还包括每个音频片段的Mel频谱图、Mel频率倒谱系数(MFCC)和频谱特性,总计5,120个CSV文件。为了更准确地识别胸声和假声技巧,数据集经过细致的手动审查并添加了性别标注。

数据集内容

  • 音频文件: 1,280个.wav文件,分为胸声和假声。
  • CSV文件: 5,120个,包含Mel频谱图、MFCC和频谱特性。
  • 性别标注: 通过手动审查添加。

数据集版本

  • 原始版本: 包含未处理的音频文件和相关特性。
  • 预处理版本: 音频片段被分割成0.25秒,转换为Mel、CQT和Chroma频谱图,格式为.jpg,总计8,974个文件。每个文件包含胸声/假声标签和性别标签。

数据集结构

  • Eval Subset: 包含Mel、CQT和Chroma频谱图,以及胸声/假声和性别标签。
  • Raw Subset: 包含音频文件、Mel频谱图、胸声/假声和性别标签。

数据集用途

  • 任务: 音频分类、歌唱方法分类、声音分类。
  • 应用: 用于歌唱相关的任务,如歌唱性别分类或胸声和假声声音分类。

数据集维护

  • 许可证: MIT License
  • 维护者: Zijin Li

数据集创建

  • 采集理由: 缺乏胸声和假声的数据集。
  • 源数据: 由中央音乐学院的学生提供。
  • 标注过程: 由中央音乐学院的学生进行音频标注。

使用注意事项

  • 社会影响: 促进音乐行业中AI的发展。
  • 偏见讨论: 仅限于胸声和假声。
  • 已知限制: 录音被切割成过短的片段,CQT频谱列存在频谱泄漏问题。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作