감정 분류를 위한 음성 데이터셋

github2021-12-03 更新2024-05-31 收录

下载链接：

https://github.com/treblenalto/korean-speech-emotion-recognition

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集使用情感对话应用程序收集，经过清理后，由5名标注者对7种情感（幸福、愤怒、厌恶、恐惧、中性、悲伤、惊讶）进行标注。在5个标签中，频率最高的情感被用作最终标签值。

This dataset was collected using an emotional dialogue application and, after cleaning, was annotated by five annotators for seven emotions (happiness, anger, disgust, fear, neutral, sadness, surprise). Among the five labels, the most frequently occurring emotion was used as the final label value.

创建时间：

2021-07-02

原始信息汇总

数据集概述

数据集名称

Korean Speech Emotion Recognition

数据集用途

用于机器学习和深度学习模块在多类别语音情感分类中的应用。

数据集来源

数据集来源于AI-Hub的KETI R&D，具体为감정 분류를 위한 음성 데이터셋。

数据集内容

数据集包含通过情感对话应用程序收集并经过清理的数据。
数据涵盖7种情感类别：happiness, angry, disgust, fear, neutral, sadness, surprise。
每条数据由5名标注者进行标注，最终标签为出现频率最高的情感类别。

数据集处理

详细的数据预处理过程可在preprocess中查看。

贡献者

김태희
정성경

搜集汇总

数据集介绍

构建方式

该数据集构建于AI-Hub的KETI R&D数据基础上，专注于韩语语音情感识别。数据采集自情感对话应用程序，经过严格的数据清洗和预处理流程，最终由五位专家对七种基本情感（快乐、愤怒、厌恶、恐惧、中性、悲伤、惊讶）进行标注。在多个标注结果中，选择出现频率最高的情感作为最终标签，确保了数据的准确性和可靠性。

特点

该数据集的特点在于其专注于韩语语音情感识别，涵盖了七种基本情感，每种情感均由五位专家进行标注，确保了数据的高质量和多样性。数据集经过精心设计，适用于机器学习和深度学习模型的训练，特别是在多类情感分类任务中表现出色。其丰富的标注信息和高质量的数据处理流程，为研究者提供了强有力的支持。

使用方法

该数据集的使用方法包括下载数据、进行必要的预处理步骤，并利用提供的标注信息进行模型训练。研究者可以根据需要选择不同的机器学习或深度学习框架，如TensorFlow或PyTorch，来构建和训练情感识别模型。数据集的结构清晰，便于直接应用于实验，同时也支持进一步的数据分析和模型优化。

背景与挑战

背景概述

감정 분류를 위한 음성 데이터셋（Korean Speech Emotion Recognition Dataset）是由韩国AI-Hub与KETI研发中心合作，于2021年发布的一个专注于语音情感识别的多分类数据集。该数据集旨在通过机器学习与深度学习技术，解决语音情感分类中的多类情感识别问题。数据集基于情感对话应用程序收集的语音数据，经过严格的数据清洗与标注流程，最终涵盖了七种情感类别（快乐、愤怒、厌恶、恐惧、中性、悲伤、惊讶）。每段语音由五名标注者进行情感标注，最终采用频率最高的情感标签作为标准。该数据集的发布为语音情感识别领域的研究提供了重要的数据支持，推动了情感计算与自然语言处理技术的进一步发展。

当前挑战

该数据集在构建与应用过程中面临多重挑战。首先，语音情感识别本身具有高度主观性，不同标注者可能对同一段语音的情感理解存在差异，导致标注一致性难以保证。其次，语音数据中的情感表达往往受到背景噪声、说话者口音及语速等因素的影响，增加了数据清洗与特征提取的难度。此外，多类情感分类任务中，情感类别的边界模糊性（如中性情感与其他情感的区分）进一步加剧了模型的训练难度。在数据构建过程中，如何确保标注质量、处理噪声数据以及设计高效的特征提取方法，均是研究者需要克服的关键挑战。

常用场景

经典使用场景

在语音情感识别领域，감정 분류를 위한 음성 데이터셋被广泛应用于多类情感分类任务中。该数据集通过机器学习与深度学习模块的应用，能够有效识别和分类七种不同的情感状态，包括快乐、愤怒、厌恶、恐惧、中性、悲伤和惊讶。这一数据集的使用场景主要集中在情感计算、人机交互以及心理健康监测等领域，为研究者提供了一个丰富的资源来训练和验证情感识别模型。

衍生相关工作

基于감정 분류를 위한 음성 데이터셋，研究者们开发了多种经典的情感识别模型和算法。例如，一些研究利用该数据集训练了深度神经网络模型，显著提高了情感识别的准确率。此外，该数据集还催生了一系列关于多模态情感识别的研究，结合语音、面部表情和生理信号等多种数据源，进一步提升了情感识别的效果。这些衍生工作不仅丰富了情感计算领域的研究内容，还为实际应用提供了更为强大的技术支持。

数据集最近研究