DEAP Dataset

github2024-09-24 更新2024-10-17 收录

下载链接：

https://github.com/athar70/MLSTM

下载链接

链接失效反馈

官方服务：

资源简介：

DEAP数据集用于训练模型，预测基于GSR、呼吸、PPG和温度信号的情感相关特征（如效价和唤醒度）。数据集包括32名受试者对40个一分钟长的视频片段的评分。

The DEAP dataset is used for training models to predict emotion-related features (such as valence and arousal) based on GSR, respiratory, PPG, and temperature signals. The dataset includes ratings from 32 subjects for 40 one-minute-long video clips.

创建时间：

2024-09-24

原始信息汇总

DEAP Dataset Emotion Recognition with MLSTM-FCN

数据集概述

受试者数量: 32
视频数量: 40（每段60秒）
评分: 情感相关特征（效价、唤醒、支配和喜好），采用9点连续量表

数据分割

总数据: (32 , ext{subjects} imes 40 , ext{videos} imes (60 + 3) , ext{seconds})
分割后数据: 25,600个数据点
重叠: 2秒重叠，5秒窗口，采样频率为128 Hz

预处理

信号预处理: GSR、呼吸、PPG和温度信号
数据分割: 5秒窗口，2秒重叠
归一化: 使用MinMaxScaler
类别平衡: 应用过采样技术
标签提取: 提取效价、唤醒等情感状态标签

模型: MLSTM-FCN

卷积层

滤波器数量: 128, 256, 128
卷积核大小: 8, 5, 3
激活函数: ReLU

LSTM配置

LSTM单元数量: 8, 64, 128（根据实验）

训练设置

训练-测试分割: 70%训练，30%测试
批量大小: 128
训练轮数: 2000
优化器: Adam
学习率: (1 imes 10^{-4})，每100轮减少(1/sqrt[3]{2})

初始结果

唤醒

批量大小	LSTM单元数量	准确率
64	8	47.3%
128	8	43.8%
128	64	41.7%
128	128	36.1%

效价

批量大小	LSTM单元数量	准确率
64	8	37.9%
128	8	47.7%
128	64	39.9%
128	128	33.5%

改进结果（过采样）

唤醒

类别数量: 9
样本数量: 45,720
批量大小: 64
LSTM单元数量: 8
训练轮数: 2000
准确率: 75.36%

效价

类别数量: 9
样本数量: 44,460
批量大小: 128
LSTM单元数量: 8
训练轮数: 2000
准确率: 77.81%

混淆矩阵

唤醒:
效价:

TensorBoard可视化

日志目录: ./log/DEAP_V_c8_b128_OverSample_e2000_log

结论

模型: MLSTM-FCN
改进: 过采样技术显著提升情感分类准确率

搜集汇总

数据集介绍

构建方式

在构建DEAP数据集时，研究者采集了32名受试者对40段一分钟长视频的情绪反应数据。这些数据包括皮肤电反应（GSR）、呼吸、光电容积脉搏波（PPG）和温度信号。数据被分割为25,600个数据点，采用5秒窗口和2秒重叠的采样方式，采样频率为128 Hz。预处理步骤包括信号的分割、归一化处理以及通过过采样技术处理类别不平衡问题，确保数据集的多样性和平衡性。

特点

DEAP数据集的显著特点在于其多模态数据的融合，涵盖了生理信号和情绪评分的综合信息。数据集通过精细的预处理步骤，确保了信号的准确性和一致性。此外，数据集的构建考虑了类别不平衡问题，通过过采样技术提升了模型的训练效果，使其在情绪识别任务中表现更为出色。

使用方法

使用DEAP数据集时，研究者可以利用预处理后的信号数据进行情绪识别模型的训练。数据集提供了详细的标签信息，包括情感的效价和唤醒度等，便于进行分类任务。通过TensorBoard，用户可以实时监控训练过程中的损失和准确率，并可视化混淆矩阵以评估模型性能。此外，数据集的过采样处理为处理类别不平衡问题提供了有效的解决方案，提升了模型的泛化能力。

背景与挑战

背景概述

DEAP数据集是由英国伦敦玛丽女王大学（Queen Mary University of London）的情感计算与心理生理学实验室创建的，旨在通过生理信号来预测情感状态。该数据集包含了32名受试者对40段一分钟长的视频的情绪反应，每段视频都记录了受试者的皮肤电反应（GSR）、呼吸、光电容积脉搏波（PPG）和体温信号。这些信号与情绪相关的特征（如效价和唤醒度）相结合，为情感识别研究提供了丰富的数据资源。DEAP数据集的创建不仅推动了情感计算领域的发展，还为心理生理学研究提供了新的视角和方法。

当前挑战

DEAP数据集在构建过程中面临了多个挑战。首先，生理信号的采集和处理需要高精度的设备和复杂的数据预处理技术，以确保信号的准确性和可靠性。其次，数据集中的情绪标签存在类别不平衡问题，这影响了模型的训练效果。此外，情感状态的预测本身就是一个复杂的任务，涉及到多模态数据的融合和高级深度学习模型的应用。尽管通过过采样技术在一定程度上缓解了类别不平衡问题，但如何进一步提升模型的分类准确性和泛化能力仍然是当前研究的主要挑战。

常用场景

经典使用场景

在情感识别领域，DEAP数据集的经典使用场景主要集中在基于生理信号的情感特征预测。该数据集通过收集32名受试者对40个一分钟视频的生理反应数据，包括皮肤电反应（GSR）、呼吸、光电容积脉搏波（PPG）和温度信号，以及相应的情感评分（如愉悦度、唤醒度、支配度和喜好度）。研究者利用这些数据训练MLSTM-FCN模型，以预测情感相关的特征，如愉悦度和唤醒度。这种基于生理信号的情感识别方法在心理学、神经科学和人工智能交叉领域具有广泛的应用前景。

实际应用

在实际应用中，DEAP数据集及其相关研究成果在多个领域展现了广泛的应用潜力。例如，在心理健康监测中，基于生理信号的情感识别技术可以帮助医生和心理学家更准确地评估患者的情感状态，从而提供个性化的治疗方案。在人机交互领域，该技术可以用于开发更智能的情感感知系统，提升用户体验。此外，在娱乐和广告行业，情感识别技术可以用于分析观众的情感反应，优化内容创作和广告投放策略。这些应用不仅提高了相关领域的技术水平，也为社会带来了实际的经济和社会效益。

衍生相关工作

DEAP数据集的发布和应用催生了大量相关的经典工作，特别是在情感识别和生理信号处理领域。例如，基于该数据集的研究论文探讨了多种情感识别模型的性能，包括传统的机器学习方法和深度学习方法。此外，一些研究者还利用DEAP数据集开发了新的情感识别算法，如结合注意力机制的神经网络模型，进一步提升了情感分类的准确性。这些衍生工作不仅丰富了情感计算领域的理论基础，也为实际应用提供了技术支持。同时，DEAP数据集的成功应用也激励了其他研究者创建和发布类似的情感相关数据集，推动了整个领域的发展。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集