SER_AMPEL
收藏arXiv2023-12-14 更新2024-06-21 收录
下载链接:
https://mmsp.unimib.it/
下载链接
链接失效反馈官方服务:
资源简介:
SER_AMPEL是一个专为意大利老年人设计的语音情感识别多源数据集,由米兰比可卡大学信息、系统和通信系创建。该数据集包含三个子集,分别收集自自然对话和电影、电视系列中的表演对话,旨在通过不同情境诱发情感。数据集的创建过程涉及对话的分割、标注和转录,应用领域包括人机交互和老年人护理,旨在通过识别情感状态提高交互的自然性和社会性。
SER_AMPEL is a multi-source speech emotion recognition dataset specifically designed for the elderly population in Italy, developed by the Department of Informatics, Systems and Communication of the University of Milan-Bicocca. This dataset includes three subsets, which are collected from both natural conversations and acted dialogues sourced from movies and television series, aiming to evoke emotions across different contexts. The dataset creation process involves dialogue segmentation, annotation and transcription. Its application fields cover human-computer interaction and elder care, with the goal of improving the naturalness and sociality of interactions by recognizing emotional states.
提供机构:
米兰比可卡大学信息、系统和通信系
创建时间:
2023-11-24
搜集汇总
数据集介绍

构建方式
SER_AMPEL数据集的构建旨在为意大利老年人的语音情感识别(SER)提供参考。该数据集通过不同的采集协议构建,包括从电影和电视剧中提取的表演对话,以及通过特定问题引发情感的自然对话。这些数据集的构建遵循了多种情感诱发方法,确保了数据的多源性和多样性。
特点
SER_AMPEL数据集的显著特点是其多源性和针对意大利老年人的专门设计。数据集包含了自然对话和表演对话两种类型,涵盖了不同的情感诱发场景。此外,数据集还考虑了年龄和语言的多样性,确保了SER模型在不同条件下的泛化能力。
使用方法
SER_AMPEL数据集可用于训练和验证语音情感识别模型,特别是在处理意大利老年人的语音数据时。研究者可以使用该数据集进行情感分类、情感特征提取等任务。数据集的多样性和多源性使其适用于跨语言和跨语料库的SER研究,为开发适应不同条件和场景的SER算法提供了丰富的资源。
背景与挑战
背景概述
随着全球老龄化人口的不断增长,关注老年人的福祉和积极老龄化成为社会的重要议题。在这一背景下,孤独和社会孤立成为影响老年人心理健康的关键因素,与抑郁症、痴呆症等严重疾病密切相关。技术在缓解老年人孤独感和社交孤立方面发挥着越来越重要的作用,特别是在研究社交机器人以提升心理健康方面。在人机交互中,情感识别(Speech Emotion Recognition, SER)尤为关键,因为它能够增强老年人与社交机器人之间的有效沟通。SER_AMPEL数据集正是在这一背景下应运而生,由米兰比可卡大学和米兰神经科学中心的研究团队创建,旨在为意大利老年人的语音情感识别提供一个多源数据集。该数据集通过不同的采集协议,包括自然对话和电影、电视剧中的表演对话,来捕捉老年人的情感表达,从而填补了现有数据集在这一领域的空白。
当前挑战
SER_AMPEL数据集在构建过程中面临多项挑战。首先,情感识别在自然对话中的准确性一直是一个难题,尤其是在跨语言和跨年龄的情况下。现有的大多数数据集主要由演员的表演对话组成,而自然对话数据集较少,这使得模型在处理真实情感表达时表现不佳。其次,数据集的构建需要考虑不同年龄段和语言背景的多样性,以确保模型的泛化能力。此外,数据集的标注和转录工作复杂且耗时,特别是对于情感的连续模型(如Valence-Arousal-Dominance模型)和分类模型(如Ekman的情感分类)的标注。最后,数据集的采集和处理过程中还需要应对不同环境下的噪音和方言问题,这些因素都可能影响情感识别的准确性。
常用场景
经典使用场景
SER_AMPEL数据集的经典使用场景主要集中在意大利老年人的语音情感识别(SER)任务中。该数据集通过收集自然对话和电影、电视剧中的表演对话,提供了丰富的情感表达样本。研究者可以利用这些数据训练和验证情感识别模型,特别是在处理老年人群体的语音情感时,这些数据尤为宝贵。
解决学术问题
SER_AMPEL数据集解决了在语音情感识别领域中,针对意大利老年人群体数据稀缺的问题。传统的情感识别数据集多集中于年轻或中年群体,而老年人的语音特征和情感表达方式有所不同。该数据集的引入填补了这一空白,为研究者提供了宝贵的资源,有助于提升情感识别模型在老年人群体中的准确性和适用性。
衍生相关工作
SER_AMPEL数据集的发布激发了大量相关研究工作。例如,研究者们利用该数据集开发了针对意大利老年人语音情感识别的深度学习模型,并探讨了跨语言和跨年龄的情感识别问题。此外,该数据集还被用于研究情感识别中的多模态融合技术,结合语音、文本和面部表情等多模态信息,进一步提升情感识别的准确性。这些研究不仅推动了语音情感识别技术的发展,也为老年人护理和社交机器人领域的应用提供了新的思路和方法。
以上内容由遇见数据集搜集并总结生成



