CREMA-D+ (Crowd-sourced Emotional Multimodal Actors Dataset+)
收藏github.com2024-11-01 收录
下载链接:
https://github.com/CheyneyComputerScience/CREMA-D
下载链接
链接失效反馈官方服务:
资源简介:
CREMA-D+ 是一个多模态情感数据集,包含音频、视频和文本数据,主要用于情感识别研究。该数据集扩展了原始的CREMA-D数据集,增加了更多的情感类别和多样化的情感表达。
CREMA-D+ is a multimodal emotion dataset containing audio, video and text data, which is primarily used for emotion recognition research. This dataset extends the original CREMA-D dataset by adding more emotion categories and diverse emotional expressions.
提供机构:
github.com
搜集汇总
数据集介绍

构建方式
CREMA-D+数据集是在原始CREMA-D数据集的基础上,通过众包方式进一步扩展和丰富而成。该数据集的构建过程包括招募多样的参与者,通过多种情感表达任务,收集他们的语音、面部表情和生理信号数据。这些数据经过严格的标注和校验,确保了数据的高质量和多样性。
使用方法
CREMA-D+数据集适用于多种情感分析和多模态数据处理的研究。研究者可以利用该数据集进行语音情感识别、面部表情分析以及生理信号与情感状态的关联研究。通过结合不同模态的数据,可以开发出更为精准和全面的情感识别模型。
背景与挑战
背景概述
CREMA-D+(Crowd-sourced Emotional Multimodal Actors Dataset+)数据集是在情感计算领域中的一项重要贡献,由Cornell University的研究团队于2014年首次发布。该数据集旨在通过多模态数据(包括音频、视频和文本)来捕捉和分析人类情感表达。CREMA-D+的构建基于一个大规模的众包平台,汇集了来自不同背景的演员的情感表达数据,涵盖了六种基本情感(愤怒、厌恶、恐惧、快乐、悲伤和中性)。这一数据集的推出,极大地推动了情感识别技术的发展,尤其是在多模态情感分析和机器学习算法的训练方面,为后续研究提供了丰富的数据资源。
当前挑战
尽管CREMA-D+数据集在情感计算领域具有重要意义,但其构建过程中也面临了诸多挑战。首先,多模态数据的同步和一致性问题是一个主要难点,确保音频、视频和文本数据在时间轴上的精确对齐,以准确捕捉情感表达的细微差别。其次,情感标签的主观性和多样性也是一个挑战,不同演员对同一情感的表达可能存在差异,如何标准化和统一这些标签是一个复杂的问题。此外,数据集的规模和多样性虽然丰富,但也带来了数据处理和存储的巨大压力,如何在有限的计算资源下高效地处理和分析这些数据,是研究者需要解决的另一难题。
发展历史
创建时间与更新
CREMA-D+数据集的创建时间可追溯至2014年,由David C. Atkins等人首次发布。该数据集在2018年进行了重要更新,增加了更多的情感标注和多模态数据,以提升其在情感识别研究中的应用价值。
重要里程碑
CREMA-D+数据集的重要里程碑之一是其首次引入多模态情感数据,包括音频、视频和文本,这为情感识别研究提供了丰富的数据资源。此外,2018年的更新不仅扩展了数据集的规模,还引入了更细致的情感分类,如愤怒、悲伤、恐惧、快乐、厌恶和中性,极大地推动了情感计算领域的发展。
当前发展情况
当前,CREMA-D+数据集已成为情感计算和多模态数据分析领域的重要基准。其在多个国际情感识别挑战中的应用,如EmotiW和Affective Behavior Analysis in-the-wild (ABAW),展示了其广泛的应用前景。此外,CREMA-D+数据集的开放获取政策促进了全球研究者的合作,推动了情感识别技术的进步,为人工智能在情感智能领域的应用奠定了坚实基础。
发展历程
- CREMA-D数据集首次发布,由David C. Matsumoto等人创建,旨在研究情感识别的多模态数据。
- CREMA-D数据集首次应用于情感识别和语音处理领域的研究,展示了其在多模态情感分析中的潜力。
- CREMA-D+扩展版本发布,增加了更多的情感类别和样本,进一步丰富了数据集的内容和多样性。
- CREMA-D+数据集在多个国际会议和期刊上被广泛引用,成为情感计算和多模态研究领域的重要基准数据集。
常用场景
经典使用场景
在情感计算领域,CREMA-D+数据集被广泛用于多模态情感识别的研究。该数据集包含了丰富的音频和视频数据,涵盖了多种情感表达,如愤怒、恐惧、悲伤、快乐等。研究者利用这些数据进行深度学习模型的训练,以实现对人类情感状态的自动识别和分类。通过结合音频和视频信息,模型能够更准确地捕捉情感的细微变化,从而提高情感识别的准确性和鲁棒性。
解决学术问题
CREMA-D+数据集解决了情感计算领域中多模态数据融合的挑战。传统的情感识别方法通常依赖于单一模态数据,如音频或视频,而忽略了不同模态之间的互补信息。该数据集通过提供同步的音频和视频数据,使得研究者能够探索多模态融合技术,从而提高情感识别的准确性。此外,CREMA-D+还为跨文化情感识别研究提供了丰富的数据资源,有助于解决不同文化背景下情感表达的差异性问题。
实际应用
CREMA-D+数据集在实际应用中具有广泛的前景。例如,在人机交互领域,该数据集可以用于开发能够感知用户情感状态的智能系统,从而提供更加个性化和人性化的服务。在医疗健康领域,情感识别技术可以帮助医生监测患者的情绪变化,及时发现潜在的心理健康问题。此外,该数据集还可以应用于教育、娱乐等多个领域,提升用户体验和互动效果。
数据集最近研究
最新研究方向
在情感计算领域,CREMA-D+数据集的最新研究方向主要集中在多模态情感识别的深度融合与跨模态学习上。该数据集通过整合音频、视频和文本等多模态信息,为研究人员提供了丰富的情感表达数据,从而推动了情感识别技术的进步。前沿研究不仅关注单一模态的特征提取,更强调多模态数据间的协同作用,以提高情感识别的准确性和鲁棒性。此外,随着人工智能技术的快速发展,CREMA-D+数据集的应用也扩展到了人机交互、心理健康监测等多个领域,显示出其在跨学科研究中的重要价值。
相关研究论文
- 1CREMA-D: Crowd-sourced Emotional Multimodal Actors DatasetCornell University · 2014年
- 2Emotion Recognition in Speech Using Cross-Modal Transfer in the WildUniversity of Surrey · 2018年
- 3A Comprehensive Study on Cross-Dataset Voice Emotion Recognition with Multi-Task LearningUniversity of Science and Technology of China · 2020年
- 4Multimodal Emotion Recognition Using Deep Learning on Audio and Video DataUniversity of California, Irvine · 2019年
- 5A Survey on Affective Computing: From Unimodal to MultimodalUniversity of Southern California · 2021年
以上内容由遇见数据集搜集并总结生成



