VitaStress

Name: VitaStress
Creator: 汉堡赫尔穆特·施密特大学数据工程系
Published: 2025-08-14 17:08:52
License: 暂无描述

arXiv2025-08-14 更新2025-11-28 收录

下载链接：

https://github.com/paulvincenz/VitaStress

下载链接

链接失效反馈

官方服务：

资源简介：

VitaStress数据集是一个新型的多模态数据集，旨在为可穿戴式情感计算研究服务，特别是自动压力识别系统的开发。该数据集在受控的实验室环境中收集了生理和运动信号，包括皮肤电活动、光电容积描记图、三轴加速度计等。实验过程中，我们区分了四种情感/活动状态：中性、身体、认知压力和社会评价压力。这些不同的阶段都被精心标记，以便进行详细的分析和重建每个实验。此外，还收集了每个压力源后的心理自我评估，以评估受试者的情感状态。该数据集的创建过程遵循了TRRRACED框架，旨在标准化压力实验和数据收集。数据集包含处理后的生命体征和运动数据，如心率、两次连续心跳之间的间隔、温度、呼吸、皮肤电导，以及光电容积描记图、皮肤电导和三轴加速度计的原始数据。除了中性基线记录外，受试者还引发了三种类型的适度压力：身体、认知和社会评价压力。该数据集在自动压力识别领域具有重要价值，有助于促进标准化协议的实施，提高数据集之间的可比性，并推动压力识别结果的验证和整合。

The VitaStress dataset is a novel multimodal dataset designed to support wearable affective computing research, particularly the development of automated stress recognition systems. It collects physiological and motion signals in a controlled laboratory environment, including electrodermal activity, photoplethysmography, triaxial accelerometers and other related signals. During the experiment, four affective/activity states were distinguished: neutral, physical stress, cognitive stress and social evaluative stress. Each of these stages was meticulously labeled to enable detailed analysis and reconstruction of each individual experiment. Additionally, psychological self-assessments were collected after each stressor to evaluate the participants' affective states. The creation of this dataset follows the TRRRACED framework, aiming to standardize stress experiments and data collection procedures. The dataset includes processed vital signs and motion data, such as heart rate, inter-beat interval, body temperature, respiration, skin conductance, as well as raw data from photoplethysmography, skin conductance and triaxial accelerometers. Apart from neutral baseline recordings, participants were induced with three types of moderate stress: physical, cognitive and social evaluative stress. This dataset holds significant value in the field of automated stress recognition, as it helps promote the implementation of standardized protocols, improve the comparability across datasets, and advance the validation and integration of stress recognition outcomes.

提供机构：

汉堡赫尔穆特·施密特大学数据工程系

创建时间：

2025-08-14

搜集汇总

数据集介绍

构建方式

VitaStress数据集的构建基于严格受控的实验室实验，遵循TRRRACED标准化框架以确保实验的可重复性与数据复用性。研究招募了21名志愿者，通过Corsano Cardiowatch腕戴式设备采集多模态生理信号，包括皮肤电活动、光电容积脉搏波、三轴加速度计等数据。实验流程精心设计了中性基线、体力应激、认知应激与社会评价应激四种情感/活动状态，每个阶段均通过自定义标注界面详细记录起止时间、身体姿势、位置等元数据，并在每次应激任务后收集心理自评量表，为数据提供了丰富的情境化注释。

特点

该数据集最显著的特点是首次在同一受试者中整合了认知、社会评价与体力三种不同类型的应激诱发范式，并提供了明确的分类标签，填补了现有公开数据集在此方面的空白。数据包含了从原始高频采样信号到预处理后心率、呼吸率、皮肤温度等衍生物理参数的多层级信息。通过主成分分析揭示，加速度计变异性和心率构成区分体力活动的主轴，而皮肤电活动与垂直加速度则在分离认知应激与基线状态上表现优异，展示出紧凑特征集对多元应激状态的良好区分能力。

使用方法

研究人员可利用标注文件中的元数据对生理信号进行事件对齐与标签化处理，构建监督学习任务。数据集支持二分类（基线vs.应激）与三分类（基线、体力、认知/社会评价应激）的基准测试。建议首先将各模态信号重采样至统一的低频（如0.33 Hz）并剔除RR间期与呼吸率等高缺失率特征，随后对每位受试者的数据进行标准化以消除个体差异。可采用留一被试交叉验证评估模型的泛化性能，随机森林与k近邻等经典算法在运动特征上展现出较高的分类精度。

背景与挑战

背景概述

VitaStress数据集由德国赫尔穆特·施密特大学数据工程系的Paul Schreiber、Beyza Cinar、Lennart Mackert和Maria Maleshkova于2025年发布，聚焦于利用可穿戴设备的多模态生理信号实现自动化压力识别。在情感计算与人机交互领域，长期压力暴露已被证实对心理健康和生理机能（如心血管疾病）具有显著危害，但现有公开数据集稀缺且缺乏标准化采集协议，导致研究结果难以复现与横向比较。VitaStress的核心贡献在于首次系统整合了认知压力、社会评价压力与体力活动三类压力源，并严格遵循TRRRACED标准化框架采集数据，涵盖皮肤电活动、光电容积脉搏波、三轴加速度等多模态信号及详细元注释。该数据集不仅填补了实验室可控环境下多类压力标注数据的空白，还通过基准实验验证了二元分类（基线vs压力）达89%准确率、三元分类（基线vs压力vs运动）达82%准确率的可行性，为构建泛化性更强的自动化压力识别系统奠定了重要数据基础。

当前挑战

VitaStress数据集所应对的核心挑战在于领域内长期存在的标准化缺失与数据碎片化问题。首先，自动化压力识别领域亟需解决公开数据集稀缺且传感器类型、压力诱发方式、标注粒度差异悬殊的困境，这严重制约了模型泛化能力的验证与跨数据集的集成研究。其次，构建过程面临多重技术难点：生理信号（如心率变异性与呼吸率）在体力活动和社会评价压力任务中缺失率高达85%以上，表明商用可穿戴设备的预处理系统难以应对运动伪迹干扰；同时，如何区分认知压力与体力活动在情绪维度的微妙差异（如主成分分析显示电生理与运动模态存在部分共线性），以及如何确保不同压力状态下标注的客观性（传统自我报告存在主观偏差），均对数据质量提出了严苛要求。此外，全球模型对部分受试者泛化失败（约14%的测试个体准确率低于64%），揭示了个体间生理反应异质性对通用模型构成的根本性挑战，凸显了个性化建模与领域适应性研究的紧迫性。

常用场景

经典使用场景

VitaStress数据集在情感计算与可穿戴压力识别领域占据重要地位，其经典使用场景聚焦于基于多模态生理与运动信号的自动化压力检测。研究人员普遍利用该数据集开展二分类（基线状态与压力状态）与三分类（基线、身体压力、认知/社会评估压力）任务，通过融合皮肤电活动、光电容积描记、三轴加速度等信号，借助随机森林、k近邻、XGBoost等经典机器学习算法实现压力状态的高精度判别。该数据集为跨个体压力识别模型的性能评估与对比提供了标准化的基准平台，尤其支持研究者探索多模态融合策略对分类效能的提升作用，并验证算法在不同压力类型区分中的鲁棒性。

解决学术问题

VitaStress数据集系统性地应对了压力识别研究中数据集稀缺、实验协议缺乏标准化以及标注不一致等关键学术瓶颈。通过严格遵循TRRRACED框架，该数据集统一了压力诱发实验的流程，涵盖了认知、身体与社会评估三类压力源与中性基线，并提供详尽的元数据与自评报告，显著提升了不同研究间的可比性与结果可复现性。该数据集填补了同时包含多种压力类型且带有明确标签的公开资源空白，助力研究者深入解析不同压力状态下生理与运动信号的差异模式，推动面向跨场景、跨个体的通用压力识别模型的构建，进而为情感计算领域的标准化与数据整合树立了重要的里程碑。

衍生相关工作

VitaStress数据集的发布催生了一系列衍生的经典研究工作。在方法学层面，该数据集启发了许多围绕多模态特征融合与去噪算法的探索，研究者利用其提供的丰富信号探讨了运动伪影对生理信号质量的影响及补偿策略。在模型构建方面，该数据集成为验证跨个体泛化能力与个体化迁移学习技术的基准，部分工作在此基础上设计了基于注意力机制的深度学习架构以提升压力分类精度。此外，该数据集推动了压力检测标准化框架的推广，多个后续研究借鉴其TRRRACED协议设计实验，从而增强了不同数据集之间的兼容性与可比性，为构建大规模、统一格式的压力识别数据库奠定了基础。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集