ccmusic-database/chest_falsetto
收藏Hugging Face2026-02-27 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ccmusic-database/chest_falsetto
下载链接
链接失效反馈官方服务:
资源简介:
原始数据集包含1280个单声道唱歌音频文件,格式为.wav,采样率为22,050 Hz,由中央音乐学院声乐专业的学生录制和注释。胸声标记为chest,假声标记为falsetto。此外,数据集还包括每个音频段的Mel频谱图、Mel频率倒谱系数(MFCC)和频谱特征,总共有5,120个CSV文件。原始数据集未区分男女声音,但通过手动审查添加了性别注释。除了原始内容外,还提供了评估期间的预处理版本,详细内容见第IV节。这种方法也应用于尚未评估的两个后续分类数据集:音乐流派数据集、美声唱法与中国民族唱法数据集。
提供机构:
ccmusic-database
原始信息汇总
数据集概述
名称: Chest voice and Falsetto Dataset 描述: 该数据集包含1,280个单声道歌唱音频文件,格式为.wav,采样率为22,050 Hz,由中央音乐学院声乐专业的学生演唱、录制并标注。音频文件分为胸声和假声两类,分别标记为_chest_和_falsetto_。此外,数据集还包括每个音频片段的Mel频谱图、Mel频率倒谱系数(MFCC)和频谱特性,总计5,120个CSV文件。为了更准确地识别胸声和假声技巧,数据集经过细致的手动审查并添加了性别标注。
数据集内容
- 音频文件: 1,280个.wav文件,分为胸声和假声。
- CSV文件: 5,120个,包含Mel频谱图、MFCC和频谱特性。
- 性别标注: 通过手动审查添加。
数据集版本
- 原始版本: 包含未处理的音频文件和相关特性。
- 预处理版本: 音频片段被分割成0.25秒,转换为Mel、CQT和Chroma频谱图,格式为.jpg,总计8,974个文件。每个文件包含胸声/假声标签和性别标签。
数据集结构
- Eval Subset: 包含Mel、CQT和Chroma频谱图,以及胸声/假声和性别标签。
- Raw Subset: 包含音频文件、Mel频谱图、胸声/假声和性别标签。
数据集用途
- 任务: 音频分类、歌唱方法分类、声音分类。
- 应用: 用于歌唱相关的任务,如歌唱性别分类或胸声和假声声音分类。
数据集维护
- 许可证: MIT License
- 维护者: Zijin Li
数据集创建
- 采集理由: 缺乏胸声和假声的数据集。
- 源数据: 由中央音乐学院的学生提供。
- 标注过程: 由中央音乐学院的学生进行音频标注。
使用注意事项
- 社会影响: 促进音乐行业中AI的发展。
- 偏见讨论: 仅限于胸声和假声。
- 已知限制: 录音被切割成过短的片段,CQT频谱列存在频谱泄漏问题。



