five

EVA-MED|情感识别数据集|心理健康数据集

收藏
arXiv2025-03-20 更新2025-03-28 收录
情感识别
心理健康
下载链接:
http://arxiv.org/abs/2503.16584v1
下载链接
链接失效反馈
资源简介:
EVA-MED数据集是由浙江大学信息科学与电子工程学院和中国科学院心理研究所共同创建的一个增强情感识别多模态数据集。该数据集通过视频和压力测试两种情感诱导范式,收集了64名参与者在不同情感状态下的EEG、ECG和PI数据,同时结合了参与者的个性特质、焦虑、抑郁等心理评估信息。数据集旨在提高情感维度的建模精度,并考虑个体差异,适用于情感识别研究,有望推动更准确、个性化、情境感知的情感计算系统的发展。
提供机构:
浙江大学信息科学与电子工程学院,中国科学院心理研究所
创建时间:
2025-03-20
AI搜集汇总
数据集介绍
main_image_url
构建方式
EVA-MED数据集的构建采用了多模态生理信号采集与心理学评估相结合的科学方法。研究团队通过两种互补的情绪诱导范式——视频刺激与曼海姆多组分压力测试(MMST),系统性地诱发64名参与者的不同效价(积极/中性/消极)和唤醒度(平静/高唤醒)情绪状态。数据采集过程整合了实验室级脑电图(EEG)、心电图(ECG)设备和消费级可穿戴设备获取的脉搏间隔(PI)数据,同时通过中国大五人格量表、PHQ-9抑郁量表等标准化问卷捕捉个体差异特征。所有生理信号均经过严格的预处理流程,包括ICA去噪、时频特征提取等,最终形成时间对齐的多模态数据集。
特点
该数据集的核心价值在于其多维度的创新设计:首先,通过双范式诱导机制实现了效价-唤醒二维情绪模型的精准覆盖,视频刺激侧重效价区分,MMST则专注高唤醒状态;其次,创新性地整合了实验室设备与可穿戴技术,在保证EEG/ECG数据精度的同时探索了PI信号的实用价值;更重要的是,数据集包含丰富的人格特质、焦虑抑郁等心理测量数据,为研究个体差异对情绪处理的影响提供了独特视角。技术验证表明,基于1DCNN模型的情绪识别准确率在EEG模态达到90.46%(效价)和93.44%(唤醒),确立了数据集的高质量基准。
使用方法
研究者可通过分层文件结构高效访问数据集资源:生理数据文件夹包含原始信号(.cnt/.acq)、分段标记数据(.npy)和预处理结果(.fif);问卷数据文件夹提供人口统计学和SAM情绪评分;刺激材料则包含分类视频文件。典型使用流程包括:基于预处理后的4秒生理信号片段提取时频域特征,结合问卷数据构建个性化情绪识别模型。数据集特别支持三种研究路径——单一模态分析可验证特定生理信号(如EEG)的判别能力;多模态融合可探索信号互补性;引入心理测量数据则能开发考虑个体差异的自适应模型。所有数据均配有详细的时间对齐标记和实验元数据,确保研究可复现性。
背景与挑战
背景概述
EVA-MED数据集由浙江大学与中国科学院心理研究所的研究团队于2025年联合发布,旨在推进基于效价-唤醒二维模型的精准情绪识别研究。该数据集创新性地整合了64名参与者的脑电图(EEG)、心电图(ECG)和脉搏间隔(PI)等多模态生理信号,并通过视频刺激与曼海姆多组分压力测试(MMST)双范式诱发不同情绪状态。其核心突破在于系统纳入了人格特质、焦虑抑郁等个体差异指标,弥补了传统数据集如DEAP、AMIGOS在个体化分析维度上的不足,为心理健康监测、人机交互等领域的个性化情感计算提供了重要数据支撑。
当前挑战
该数据集面临双重挑战:在领域问题层面,现有情绪识别模型对高唤醒状态与个体差异的捕捉仍存在精度局限,尤其穿戴设备采集的PI数据受采样率制约导致长程心率变异性分析困难;在构建过程中,多模态信号的时间同步、实验室级EEG/ECG与消费级穿戴设备的数据异构性融合,以及应激范式下情绪标签的客观验证均构成技术难点。此外,样本群体局限于青年学生,其生态效度向跨文化、全年龄场景的扩展仍需进一步探索。
常用场景
经典使用场景
EVA-MED数据集在情感计算领域具有广泛的应用价值,尤其在情感识别研究中展现了其独特优势。该数据集通过整合脑电图(EEG)、心电图(ECG)和脉搏间隔(PI)等多模态生理信号,结合视频刺激和曼海姆多成分压力测试(MMST)两种情感诱导范式,为研究者提供了丰富的情感状态数据。其经典使用场景包括基于深度学习的多模态情感识别模型开发,以及情感维度(效价和唤醒度)的精确建模。数据集的独特之处在于它不仅捕捉了广泛的情感反应,还系统性地考虑了人格特质、焦虑和抑郁等个体差异因素,为个性化情感识别研究提供了坚实基础。
衍生相关工作
EVA-MED数据集已经催生了一系列重要的衍生研究。基于该数据集的1D-CNN模型在情感效价和唤醒度识别任务中取得了突破性性能(准确率分别达90.46%和93.44%)。研究者还开发了融合多模态特征的集成学习框架,显著提升了情感状态分类的鲁棒性。在个性化情感建模方面,多项研究利用数据集中的心理评估数据,建立了考虑人格特质的自适应情感识别算法。此外,数据集的可穿戴设备数据分支促进了移动端轻量化情感识别模型的开发,为情感计算技术在消费电子产品中的应用铺平了道路。
数据集最近研究
最新研究方向
EVA-MED数据集作为情感计算领域的重要资源,其最新研究方向聚焦于多模态生理信号与个体差异的深度融合。通过整合脑电图、心电图和脉搏间隔数据,并结合人格特质、焦虑抑郁等心理评估指标,该数据集为建立个性化情感识别模型提供了前所未有的多维视角。当前前沿探索集中在三个维度:基于深度学习的跨模态特征融合算法优化,旨在提升效价-唤醒二维情感模型的预测精度;穿戴式设备采集的生理信号在真实场景中的生态效度验证,推动实验室成果向日常应用转化;个体心理特征对情感响应模式的调节机制研究,为精神健康监测提供客观量化依据。这些研究不仅推动了情感计算与临床心理学的交叉创新,也为智能人机交互、远程心理健康服务等热点应用场景提供了关键技术支撑。
相关研究论文
  • 1
    EVA-MED: An Enhanced Valence-Arousal Multimodal Emotion Dataset for Emotion Recognition浙江大学信息科学与电子工程学院,中国科学院心理研究所 · 2025年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

Breast Cancer Dataset

该项目专注于清理和转换一个乳腺癌数据集,该数据集最初由卢布尔雅那大学医学中心肿瘤研究所获得。目标是通过应用各种数据转换技术(如分类、编码和二值化)来创建一个可以由数据科学团队用于未来分析的精炼数据集。

github 收录

中国1km分辨率逐月降水量数据集(1901-2024)

该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2024.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。

国家青藏高原科学数据中心 收录

Pima Indians Diabetes Database

该项目使用的数据集是Pima Indians Diabetes Database,来源于UCI机器学习库。该数据集包含多个医学预测变量和一个目标变量,即Outcome,用于指示患者是否患有糖尿病(1)或未患(0)。

github 收录

ner_training_stanza

该数据集包含文本数据及其相应的命名实体识别信息。文本被分词,并且命名实体识别信息既包括词级别也包括字符级别。数据集分为训练集、验证集和测试集,适用于进一步的自然语言处理任务。

huggingface 收录

Plant-Diseases

Dataset for Plant Diseases containg variours Plant Disease

kaggle 收录