ccmusic-database/pianos
收藏Hugging Face2025-04-05 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ccmusic-database/pianos
下载链接
链接失效反馈官方服务:
资源简介:
Piano Sound Quality Dataset包含12个全范围音频文件和1,320个分割的单声道音频文件,总计1,332个文件。此外,还包括一个包含29位有音乐背景的参与者对钢琴音质进行主观评估的评分表。数据集扩展后包含2,020个音频文件,并通过数据增强生成了18,745个Mel频谱图切片。数据集支持钢琴音质分类和音高检测任务,主要用于开发钢琴音质评分应用。
Piano Sound Quality Dataset contains 12 full-range audio files and 1,320 segmented mono audio files, with a total of 1,332 files. In addition, it includes a rating sheet with subjective evaluations of piano sound quality from 29 participants with musical backgrounds. The expanded dataset contains 2,020 audio files, and 18,745 Mel spectrogram slices generated via data augmentation. This dataset supports piano sound quality classification and pitch detection tasks, and is mainly used for developing piano sound quality scoring applications.
提供机构:
ccmusic-database
原始信息汇总
数据集概述
数据集名称: Piano Sound Quality Dataset 数据集别名: 钢琴音质数据集
数据集详细信息
- 许可: MIT
- 任务类别: 音频分类、图像分类
- 语言: 英语
- 标签: 音乐、艺术
- 数据集大小: 10K<n<100K
数据集内容
- 原始数据集: 包含12个全范围音频文件,格式为.wav/.mp3/.m4a,代表7种钢琴模型。此外,还有1,320个分割的单声道音频文件,总文件数为1,332。还包括一个.xls格式的评分表,包含29名具有音乐背景的参与者提供的主观钢琴音质评估。
- 扩展数据集: 由于需要增加数据集大小且缺少流行的钢琴品牌Yamaha,数据集通过录制立式Yamaha钢琴进行扩展,共包含2,020个音频文件。数据增强后,原始音频转换为Mel频谱图,并切割成0.18秒的片段,共产生18,745个频谱图切片。
数据集结构
- 评估子集: 包含Mel频谱图(.jpg格式,0.18秒,48000Hz)、8类标签和88类音高。
- 原始子集: 包含音频文件(.wav格式,22050Hz)、Mel频谱图(.jpg格式,22050Hz)、8类标签和88类音高。
数据集使用
- 加载数据集: 使用
load_dataset函数加载数据集,支持训练、验证和测试集的访问。
数据集创建
- 采集和标注: 由CCMUSIC和CCOM的学生录制不同钢琴声音并进行标注,随后进行主观音质评估。
- 数据来源: 数据由Zhaorui Liu, Shaohua Ji, Monan Zhou收集和标准化。
- 标注者: CCMUSIC和CCOM的学生。
数据集考虑因素
- 社会影响: 有助于开发钢琴音质评分应用。
- 偏见和限制: 仅限于钢琴,存在数据不平衡问题。
附加信息
- 数据集维护者: Zijin Li
- 评估研究: 使用数据集进行钢琴音质全面评估的研究。
- 许可证: MIT许可证,允许自由使用、复制、修改、合并、发布、分发、转授和/或出售软件副本。
贡献
提供了一个用于钢琴音质研究的数据集。



