Perceived Singing Voice Femininity Survey Data

github2025-11-05 更新2025-11-06 收录

下载链接：

https://github.com/deezer/perceived_singing_voice_femininity

下载链接

链接失效反馈

官方服务：

资源简介：

该存储库包含论文《感知歌唱声音中的女性特质：分析与预测》中收集的调查结果，该论文已被CMMR 2025接受。调查使用的音频片段可从STraDa获取，具体使用了STraDa测试集中的1200个片段。数据集包含参与者信息文件(participant_info.csv)和所有答案文件(all_answer.csv)，记录了参与者的性别、语言、年龄范围以及乐器演奏情况，以及他们对歌唱片段女性特质的评分。

This repository contains the survey results collected for the paper *Perceptual Femininity in Singing Voices: Analysis and Prediction*, which has been accepted for CMMR 2025. The audio clips utilized in the survey are accessible from STraDa, with 1200 clips specifically selected from the STraDa test set. The dataset includes the participant information file (participant_info.csv) and the all-answer file (all_answer.csv), which record the participants' gender, language, age range, musical instrument playing experience, as well as their ratings of the femininity of the singing clips.

创建时间：

2025-10-10

原始信息汇总

Perceived Singing Voice Femininity Survey Data 数据集概述

数据集来源

该数据集收集自论文《Perceived femininity in singing voice: analysis and prediction》（CMMR 2025，伦敦）
音频片段来源于STraDa测试集的1200个片段，可从STraDa下载

文件构成

participant_info.csv

包含参与者信息，字段包括：

username：唯一用户ID（格式为x_y，表示第x次调查的第y位参与者）
female/male：参与者性别
english/french/mandarin/spanish/german：语言掌握情况（1表示掌握，0表示未掌握）
0/20/35/50/65：年龄范围（0代表0-19岁，20代表20-34岁，35代表35-49岁等）
instruments：是否演奏乐器

all_answer.csv

包含调查回答数据，字段包括：

segment_name：片段ID（对应STraDa测试集中的ID）
gender/age/language：歌手的性别、年龄组和语言信息
x_y：用户ID（对应participant_info.csv中的username）
空值表示参与者认识歌手/歌曲

数据说明

论文中报告了126个有效回答
由于数据意外删除，参与者1_1的回答无法恢复

引用格式

bibtex @inproceedings{kong2025perceived, title={Perceived femininity in singing voice: analysis and prediction}, author={Kong, Yuexuan and Tran, Viet-Anh and Hennequin, Romain}, booktitle={The 17th International Symposium on Computer Music Multidisciplinary Research (CMMR 2025)}, year={2025} }

搜集汇总

数据集介绍

构建方式

在音乐信息检索领域，针对歌唱声音感知的研究需要高质量的数据支撑。该数据集基于STraDa测试集中的1200个音频片段构建，通过系统性调查收集参与者对歌声女性化程度的感知评价。调查过程记录了每位参与者的性别、语言背景、年龄区间及乐器演奏能力等人口统计学信息，并采用匿名化编码确保数据隐私。数据收集过程中虽存在部分数据丢失的技术瑕疵，但整体保持了科研数据的严谨性与可追溯性。

特点

该数据集的特点体现在多维度标注的交叉验证机制上。除基础的声音片段与感知评分对应关系外，还同步收录了演唱者的性别、年龄分组和语言特征等元数据。参与者信息涵盖五大语言群体与四个年龄区间的分层样本，且通过二进制标识区分乐器掌握情况。独特的空值标注设计区分了熟悉演唱者与陌生听众的感知差异，为研究认知偏差提供了数据基础。

使用方法

使用本数据集时需结合STraDa原始音频文件进行联合分析。研究者可通过匹配segment_name字段调用对应音频片段，并关联participant_info中的用户属性数据。分析过程应注意空值条目代表的特殊语义，避免数据误读。该数据集适用于计算听觉场景分析、跨文化音乐感知研究等方向，引用时需遵循指定的文献格式以确保学术规范性。

背景与挑战

背景概述

在音乐信息检索与声学感知研究领域，歌唱声音的性别感知特性逐渐成为跨学科关注焦点。Perceived Singing Voice Femininity Survey Data数据集由Kong等学者于2025年构建，依托CMMR国际研讨会平台发布，旨在解析歌唱声音中女性化特征的感知机制。该数据集基于STraDa测试集的1200个音频片段，通过系统化收集听众对演唱者性别特征的感知评分，为声学参数与主观感知的关联性研究提供了实证基础，推动了歌唱声音合成与跨文化音乐认知研究的发展。

当前挑战

歌唱声音性别感知研究面临双重挑战：在领域问题层面，需克服声学特征与主观感知间的非线性映射难题，例如音色、共振峰等参数如何跨语言与文化背景影响女性化感知；在数据构建过程中，存在参与者语言多样性导致的评分偏差控制、音频片段元数据对齐复杂性，以及因数据意外删除造成的样本完整性缺失问题，这些因素共同制约着模型泛化能力与结论普适性。

常用场景

经典使用场景

在音乐信息检索领域，该数据集为研究歌唱声音的感知特征提供了关键支持。其经典应用场景包括通过大规模听众调查，分析不同性别、年龄和语言背景的参与者对歌唱声音女性化程度的感知差异。数据集结合了STraDa测试集中的1200个音频片段，使研究者能够系统探索声音特征与主观感知之间的复杂关联，为声学心理学研究奠定数据基础。

衍生相关工作

基于该数据集衍生的经典研究主要集中在计算音乐学与声学信号处理的交叉领域。后续工作可能围绕构建感知特征预测模型展开，开发基于深度学习的歌唱声音分析框架。这些研究将进一步拓展到多模态音乐情感计算、自适应音乐推荐系统等方向，形成以感知数据驱动的音乐技术研究新范式。

数据集最近研究