FinnAffect

Name: FinnAffect
Creator: 坦佩雷大学
Published: 2025-05-23 20:47:21
License: 暂无描述

arXiv2025-05-23 更新2025-05-28 收录

下载链接：

http://arxiv.org/abs/2505.17833v1

下载链接

链接失效反馈

官方服务：

资源简介：

FinnAffect是一个芬兰语情感语音语料库，由12,000个话语组成，用于标注情感唤醒和效价。该语料库是从三个大型芬兰语语音语料库中抽取的，并使用情感挖掘方法来确保情感表达的多样性。数据集由五个芬兰语母语者进行标注，并提供了情感唤醒和效价的连续评分。FinnAffect语料库的创建旨在为芬兰语中的情感表达和感知研究提供合适的数据资源，并为其他语言或领域的情感语音语料库创建提供采样策略。

FinnAffect is a Finnish affective speech corpus comprising 12,000 utterances annotated for emotional arousal and valence. This corpus is sampled from three large-scale Finnish speech corpora, and affective mining methods are employed to ensure the diversity of emotional expressions. The dataset is annotated by five native Finnish speakers, and provides continuous scores for emotional arousal and valence. The FinnAffect corpus was developed to provide suitable data resources for research on emotional expression and perception in Finnish, as well as sampling strategies for the creation of affective speech corpora in other languages or domains.

提供机构：

坦佩雷大学

创建时间：

2025-05-23

搜集汇总

数据集介绍

构建方式

FinnAffect数据集的构建采用了多源语料库融合与情感挖掘技术相结合的创新方法。研究团队从Lahjoita Puhetta、TamPuhe和HelPuhe三个芬兰语自发语音语料库中筛选出147万条语音片段，通过声学特征（eGeMAPS）、跨语言语音情感分类特征（ExHuBERT）和文本情感分析特征（FinnSentiment）的三维特征融合，采用基于k-medoids聚类的主动学习方法（MAL）从海量数据中精选12,000条具有情感表达多样性的语音样本。为确保标注质量，所有样本均经过严格的前后语境处理，并由五位母语标注者在控制环境下完成唤醒度和效价的双维度连续标注。

特点

作为首个芬兰语自发情感语音数据库，FinnAffect的核心价值体现在其生态效度与标注深度。数据集包含3,936名说话人的语音样本，覆盖不同性别（男性3,902条，女性6,425条）和年龄层，平均样本时长为4.02±2.71秒。通过离散化处理形成唤醒度（低/高）和效价（负/中/正）的类别标签，其中效价标注呈现典型的三峰分布（负向2,741条，中性7,178条，正向2,081条），唤醒度则保持相对平衡（低5,685条，高6,315条）。特别值得注意的是，数据集保留了原始语音的副语言特征和自然对话韵律，为研究芬兰语特有的情感表达模式提供了珍贵素材。

使用方法

该数据集主要服务于语音情感识别（SER）系统的开发与跨文化情感研究。使用者可通过提取标准化后的声学特征与文本转录特征，结合提供的连续/离散情感标签，构建端到端的情感分类模型。研究建议采用交叉验证策略处理说话人相关变异，并利用数据集中包含的2,000条五人标注黄金标准集进行模型可靠性验证。对于语言学研究者，可重点分析效价标注与文本情感特征的关联模式，或探究唤醒度与声学参数的相关性。计算资源受限时，可采用基于最远优先遍历（FAFT）的子采样策略优化模型训练效率。

背景与挑战

背景概述

FinnAffect是首个针对芬兰语自发情感语音的语料库，由坦佩雷大学的信号处理研究中心和语言研究团队于2025年创建。该数据集填补了芬兰语情感语音研究的空白，通过标注12,000个语音片段的情感唤醒度和效价，为语音情感识别（SER）系统提供了重要资源。其创新之处在于采用声学特征、跨语言语音情感分类器及文本情感分析相结合的方法进行样本选择，旨在覆盖广泛的情感表达。该数据集的建立不仅推动了芬兰语情感计算研究，也为其他语言或领域的情感语音语料库构建提供了方法论参考。

当前挑战

FinnAffect面临的核心挑战包括两方面：在领域问题层面，需解决自发情感语音样本稀缺、标注一致性低的问题，尤其是针对芬兰语这类资源较少的语言；在构建过程中，技术挑战集中在海量数据的高效采样——传统聚类方法因计算复杂度无法处理140万条语音，需开发基于CLARA算法的改进方案。此外，跨模态特征（声学、文本、跨语言情感）的融合与平衡、以及后验分析中发现的初始聚类策略对多样性的影响，均为构建过程中的关键难点。

常用场景

经典使用场景

FinnAffect数据集作为首个芬兰语自发情感语音语料库，其经典使用场景主要集中在语音情感识别（SER）系统的开发与评估。该数据集通过结合声学特征、跨语言语音情感分类器特征以及文本情感分析特征，为研究者提供了丰富的情感标注数据，特别适用于探索芬兰语中情感表达的独特模式及其与语音信号的关系。

衍生相关工作

基于FinnAffect的采样方法论，衍生出多项关于情感语音数据高效标注的研究。其采用的聚类式主动学习策略（如k-medoids聚类与FAFT初始化）被扩展应用于其他低资源语言的语料构建。数据集特征工程中融合多模态特征（声学、文本、跨语言）的思路也影响了后续跨文化情感计算研究的设计框架。

数据集最近研究