five

Continuously Annotated Signals of Emotion (CASE) dataset

收藏
arXiv2018-12-07 更新2024-06-21 收录
下载链接:
https://rmc.dlr.de/download/CASE_dataset/CASE_dataset.zip
下载链接
链接失效反馈
官方服务:
资源简介:
CASE数据集由德国航空航天中心机器人与机电一体化研究所创建,专注于实时连续情感标注,包含30名参与者在观看视频时的生理信号和情感标注数据。数据集大小涵盖了多种生理信号,如心电图、血容量脉搏、皮肤电反应等,以及通过创新的手柄式标注界面同时记录的情感维度(效价和唤醒度)。创建过程涉及开发新型标注工具和收集验证视频刺激。该数据集应用于情感计算领域,旨在解决情感状态的实时评估问题,为心理学和情感AI社区提供研究资源。

The CASE Dataset was developed by the Institute of Robotics and Mechatronics at the German Aerospace Center. Focused on real-time continuous emotion annotation, this dataset contains physiological signal and emotion annotation data collected from 30 participants during video viewing. It encompasses a diverse set of physiological signals including electrocardiogram (ECG), blood volume pulse (BVP), galvanic skin response (GSR), among others, alongside emotion dimensions (valence and arousal) recorded synchronously through an innovative handle-based annotation interface. The development of this dataset involved creating a novel annotation tool and curating validated video stimuli. Targeted at the field of affective computing, this dataset aims to address the challenge of real-time emotional state assessment, serving as a valuable research resource for the psychology and affective AI communities.
提供机构:
德国航空航天中心机器人与机电一体化研究所
创建时间:
2018-12-07
搜集汇总
数据集介绍
main_image_url
构建方式
在情感计算领域,构建高质量数据集对于理解情绪动态至关重要。CASE数据集通过精心设计的实验流程构建而成,招募了30名参与者,男女各半,年龄跨度为22至37岁。实验采用视频刺激诱发情绪,包括娱乐、无聊、放松和恐惧四种类型,每种类型包含两个经过验证的视频片段。数据采集过程中,参与者使用基于操纵杆的JERI界面实时同步标注效价和唤醒度,同时通过高精度传感器以1000Hz采样率记录八种生理信号,包括心电图、血容量脉冲、皮肤电反应、呼吸、皮肤温度及三处肌电图。所有数据经过时间戳同步、线性插值处理,并添加视频标识信息,最终以CSV格式保存,确保数据的一致性和可访问性。
特点
CASE数据集的显著特点在于其连续同步的标注机制与多模态生理信号的深度融合。该数据集创新性地采用操纵杆界面,允许参与者在观看视频时实时报告二维情绪体验,克服了传统独立标注的局限性,更贴近情绪的自然动态变化。生理信号采集涵盖心血管、皮肤电和肌肉活动等多个维度,以高采样率确保数据的精细度,为情绪建模提供了丰富特征。数据集经过严格的预处理,包括插值和标准化,同时提供原始与处理后的双版本,支持不同研究需求。其设计充分考虑了生态效度,视频刺激经过预研究验证,标注数据通过统计分析和系统可用性评估确认了可靠性与直观性。
使用方法
CASE数据集适用于情感计算、心理学及人机交互领域的多类研究。使用者可首先访问figshare存储库获取数据档案,其中包含插值与非插值目录、标注文件及生理数据文件,均以参与者ID命名。标注数据包含时间戳、效价、唤醒度及视频ID列,生理数据则涵盖八种传感器输出。研究人员可利用这些连续标注探索情绪动态模式,例如通过变化点分析识别情绪转折;或提取生理特征如心率变异性、皮肤电反应幅度,与标注数据关联以构建情绪识别模型。数据集支持机器学习流程,包括特征工程、分类或回归任务,并已通过主成分分析验证了生理与标注数据的一致性。用户还可参考提供的元数据文件了解参与者信息和视频序列,以复现或扩展实验设计。
背景与挑战
背景概述
情感计算领域致力于开发能够识别、解释并适应人类情感的机器系统,然而情感的内在性使其难以被外部系统直接观测。为应对这一挑战,德国航空航天中心机器人学与机电一体化研究所联合乌得勒支大学、乌尔姆大学的研究团队于2018年创建了连续标注情感信号数据集。该数据集聚焦于情感维度的实时连续标注,通过创新的摇杆式标注界面,同步记录效价与唤醒度,并同步采集八种高质量的生理信号。其核心研究在于解决情感标注中维度分离与工具非人性化的问题,为情感状态的动态建模提供了关键数据支撑,推动了情感计算向更自然、连续的分析范式演进。
当前挑战
在情感计算领域,情感状态的高效准确标注始终是核心挑战。传统方法常将效价与唤醒度分开标注,忽略了维度间的内在关联;同时,基于鼠标的标注工具在人机交互中缺乏人体工程学优势,影响标注的连续性与自然度。在数据集构建过程中,研究团队需设计并验证一种能够同步记录双维情感的摇杆界面,确保其在实时标注中的直观性与可靠性。此外,多模态数据的同步采集与处理亦面临技术复杂性,包括高采样率生理信号的精确获取、时间戳同步以及数据插值等环节,均需严谨的技术方案以保障数据质量与一致性。
常用场景
经典使用场景
在情感计算领域,连续情感标注信号数据集(CASE)为研究者提供了探索情感动态变化过程的珍贵资源。该数据集最经典的应用场景在于构建和验证基于生理信号的情感识别模型。通过将高精度同步采集的八种生理信号(如心电图、皮电反应、肌电图等)与连续二维情感标注(效价和唤醒度)相结合,研究人员能够深入分析情感状态与生理反应之间的实时对应关系。这种多模态数据融合为开发更精准、更自然的人机交互系统奠定了实证基础。
解决学术问题
CASE数据集有效解决了情感计算研究中长期存在的若干关键问题。传统离散情感标注方法难以捕捉情感的强度变化和时序动态特性,而该数据集通过创新的摇杆式连续标注界面,实现了效价与唤醒度的同步实时报告,克服了维度分离标注的局限性。同时,高质量同步生理信号的提供,使得研究者能够检验情感维度理论与生理指标之间的映射关系,为情感模型的验证与优化提供了可靠的数据支撑,推动了情感状态客观量化方法的发展。
衍生相关工作
CASE数据集自发布以来,已衍生出多个具有影响力的研究方向和相关工作。其创新的摇杆式连续标注范式(JERI)启发了后续类似标注工具的开发,如DARMA等。在方法论层面,基于该数据集的研究推动了连续二维情感轨迹的分析技术,例如变化点检测算法和函数型数据分析方法在情感计算中的应用。此外,数据集被广泛用于验证多模态情感融合模型的有效性,特别是在生理信号特征提取与情感维度回归方面,催生了一系列关于特征选择、时序建模以及跨被试泛化能力的研究,深化了学界对情感生理基础的理解。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作