CREMA-D (Crowd-sourced Emotional Multimodal Actors Dataset)
收藏github.com2024-11-01 收录
下载链接:
https://github.com/CheyneyComputerScience/CREMA-D
下载链接
链接失效反馈官方服务:
资源简介:
CREMA-D是一个多模态情感演员数据集,包含7442个音频片段,由91名演员在48个不同的短语上表达6种基本情感(愤怒、厌恶、恐惧、快乐、悲伤、惊讶)和一种中性情感。数据集还包括视频和面部表情数据。
CREMA-D is a multimodal emotional actor dataset containing 7,442 audio clips, where 91 actors expressed 6 basic emotions (anger, disgust, fear, happiness, sadness, surprise) and one neutral emotion across 48 distinct phrases. The dataset also includes video and facial expression data.
提供机构:
github.com
搜集汇总
数据集介绍

构建方式
在情感计算领域,CREMA-D数据集的构建基于众包策略,汇集了来自不同背景的演员的情感表达。该数据集通过精心设计的实验,要求演员在特定情境下表达六种基本情感(愤怒、厌恶、恐惧、快乐、悲伤和中性)。每个情感表达被录制为音频和视频格式,确保多模态数据的完整性。此外,数据集还包含了详细的元数据,如演员的性别、年龄和情感强度,以增强数据的可解释性和应用范围。
特点
CREMA-D数据集以其多模态特性和情感多样性著称。该数据集不仅提供了高质量的音频和视频数据,还通过多角度捕捉情感表达,增强了情感识别的准确性。此外,数据集的众包性质确保了情感表达的多样性和真实性,使其在跨文化情感研究中具有重要价值。数据集的结构化设计也便于研究人员进行情感分类和分析,是情感计算领域的重要资源。
使用方法
CREMA-D数据集适用于多种情感计算任务,包括但不限于情感识别、情感分类和情感生成。研究人员可以通过提取音频和视频特征,结合机器学习算法,训练情感识别模型。此外,数据集的多模态特性允许进行跨模态情感分析,探索音频和视频数据之间的关联。数据集的元数据也为个性化情感分析提供了可能,研究人员可以根据演员的性别、年龄等特征进行细分研究,提升模型的泛化能力和应用场景的多样性。
背景与挑战
背景概述
CREMA-D(Crowd-sourced Emotional Multimodal Actors Dataset)数据集由Cornell大学于2014年发布,旨在推动情感识别领域的研究。该数据集由7443个音频片段组成,涵盖了6种基本情感(愤怒、厌恶、恐惧、快乐、悲伤和中性),由91名演员在不同情感状态下录制。CREMA-D的独特之处在于其多模态特性,包括音频、视频和文本,为研究人员提供了丰富的数据资源。该数据集的发布极大地促进了情感计算和心理健康领域的研究,特别是在情感识别算法的开发和验证方面。
当前挑战
CREMA-D数据集在构建过程中面临多项挑战。首先,情感标注的一致性问题,不同演员对同一情感的表达可能存在差异,增加了标注的复杂性。其次,多模态数据的同步和整合,确保音频、视频和文本数据在时间轴上的精确对齐,是一项技术难题。此外,数据集的多样性和代表性也是一个挑战,如何在有限的样本中尽可能覆盖不同年龄、性别和文化背景的演员,以提高模型的泛化能力。这些挑战共同构成了CREMA-D数据集在情感识别研究中的重要课题。
发展历史
创建时间与更新
CREMA-D数据集由David C. Watson和Jonathan Gratch于2014年创建,旨在提供一个多模态的情感表达数据集。该数据集自创建以来未有官方更新记录。
重要里程碑
CREMA-D数据集的创建标志着情感计算领域的一个重要里程碑。它首次集成了音频、视频和文本数据,为研究人员提供了一个全面的多模态情感分析平台。该数据集的发布促进了情感识别算法的发展,特别是在自动情感识别和情感生成模型方面。此外,CREMA-D的多样性和高质量数据使其成为多个国际竞赛和研究项目的首选数据集。
当前发展情况
目前,CREMA-D数据集在情感计算和人工智能领域仍具有重要地位。它被广泛应用于情感识别、语音情感分析和多模态情感交互等研究方向。随着深度学习技术的进步,CREMA-D数据集为开发更复杂的情感模型提供了宝贵的资源。尽管已有新的数据集出现,CREMA-D因其历史地位和数据质量,仍然是情感计算研究中的经典数据集之一。
发展历程
- CREMA-D数据集首次发表,由Cornell University的研究团队创建,旨在通过众包方式收集多模态情感数据。
- CREMA-D数据集首次应用于情感识别研究,成为情感计算领域的重要基准数据集之一。
- CREMA-D数据集被广泛应用于多模态情感分析和机器学习模型的训练,推动了情感识别技术的发展。
- CREMA-D数据集的扩展版本发布,增加了更多的情感类别和样本,进一步丰富了数据集的内容。
常用场景
经典使用场景
在情感计算领域,CREMA-D数据集以其多模态特性成为研究情感识别的经典资源。该数据集包含了由不同演员表演的情感视频片段,涵盖了六种基本情感:愤怒、厌恶、恐惧、快乐、悲伤和中性。研究者常利用此数据集进行跨模态情感分析,通过结合音频、视频和文本信息,探索情感表达的复杂性及其在不同模态间的交互作用。
解决学术问题
CREMA-D数据集在解决情感计算中的多模态融合问题上具有重要意义。它为研究者提供了一个标准化的平台,用于开发和验证多模态情感识别算法。通过分析音频、视频和文本数据,研究者能够深入理解情感在不同模态中的表现形式,从而提高情感识别的准确性和鲁棒性。此外,该数据集还促进了跨学科研究,如心理学与计算机科学的结合,推动了情感计算领域的发展。
衍生相关工作
CREMA-D数据集的发布激发了大量相关研究工作。例如,基于该数据集,研究者开发了多种多模态情感识别模型,如深度学习网络和混合模型,显著提升了情感识别的性能。此外,该数据集还被用于研究情感的跨文化差异,通过比较不同文化背景下的情感表达,揭示了情感的普遍性和特殊性。这些研究不仅丰富了情感计算的理论基础,也为实际应用提供了技术支持。
以上内容由遇见数据集搜集并总结生成



