SAM 40 Dataset
收藏github2022-12-15 更新2024-05-31 收录
下载链接:
https://github.com/wavesresearch/eeg_stress_detection
下载链接
链接失效反馈官方服务:
资源简介:
SAM 40数据集用于通过EEG记录进行压力分类。数据集包含不同类型的EEG数据,如原始数据、带通滤波数据和ICA滤波数据。
The SAM 40 dataset is utilized for stress classification through EEG recordings. The dataset encompasses various types of EEG data, including raw data, band-pass filtered data, and ICA filtered data.
创建时间:
2022-10-06
原始信息汇总
EEG Stress Detection 数据集概述
数据集描述
- 数据集基于SAM 40 Dataset,用于通过EEG记录进行压力分类。
文件结构
dataset
-
load_dataset(data_type="ica_filtered", test_type="Arithmetic")
- 功能:加载指定类型的SAM 40数据集。
- 参数:
data_type可选值为raw, wt_filtered, ica_filtered;test_type指定测试类型。 - 返回:形状为(120, 32, 3200)的ndarray。
-
load_labels()
- 功能:从数据集中加载标签并转换为二进制值。
- 转换规则:值大于5设为1,小于等于5设为0。
-
format_labels(labels, test_type="Arithmetic", epochs=1)
- 功能:根据指定的测试类型过滤标签,并根据记录中的epochs重复标签。
-
split_data(dataset, sfreq)
- 功能:将EEG数据分割成1秒长度的epochs。
filtering
- 包含数据过滤的笔记本,使用bandpass过滤、Savitzky-Golay过滤和ICA过滤。
- ICA组件通过视觉检查确定噪声和伪影,并使用GUI进行选择。
- 数据可以保存到目录中用于分类。
features
-
time_series_features(data)
- 功能:计算峰值至峰值幅度、方差和rms等特征。
- 输入:形状为(n_trials, n_secs, n_channels, sfreq)的数据。
- 输出:形状为(n_trialsn_secs, n_channelsn_features)。
-
freq_band_features(data, freq_bands)
- 功能:计算delta、theta、alpha、beta和gamma等频带特征。
- 输入:形状为(n_trials, n_secs, n_channels, sfreq)的数据。
- 输出:形状为(n_trialsn_secs, n_channelsn_features)。
-
hjorth_features(data)
- 功能:计算Hjorth移动性(频谱)和Hjorth复杂性(频谱)特征。
- 输入:形状为(n_trials, n_secs, n_channels, sfreq)的数据。
- 输出:形状为(n_trialsn_secs, n_channelsn_features)。
-
fractal_features(data)
- 功能:计算Higuchi分形维度和Katz分形维度特征。
- 输入:形状为(n_trials, n_secs, n_channels, sfreq)的数据。
- 输出:形状为(n_trialsn_secs, n_channelsn_features)。
-
entropy_features(data)
- 功能:计算近似熵、样本熵、频谱熵和SVD熵等特征。
- 输入:形状为(n_trials, n_secs, n_channels, sfreq)的数据。
- 输出:形状为(n_trialsn_secs, n_channelsn_features)。
classification
- 使用从features加载的特征进行分类,使用KNN分类器、SVM分类器和MLP。
variables
- 包含项目中使用的全局变量的脚本。
搜集汇总
数据集介绍

构建方式
SAM 40数据集通过脑电图(EEG)记录构建,旨在检测压力状态。数据采集过程中,受试者被要求完成特定任务,如算术测试,以诱发不同程度的压力反应。EEG信号经过多种预处理步骤,包括原始信号采集、带通滤波、ICA滤波等,以确保数据的质量和可用性。数据以多维数组形式存储,便于后续分析和分类任务。
使用方法
使用SAM 40数据集时,首先通过`load_dataset`函数加载指定测试类型的数据,如算术测试。数据加载后,可通过`load_labels`函数获取二值化标签。为进一步处理数据,可使用`split_data`函数将EEG信号分割为1秒的片段。特征提取可通过`time_series_features`、`freq_band_features`等函数实现,提取的特征可用于分类任务。分类任务支持KNN、SVM和MLP等算法,用户可根据需求选择合适的分类器进行压力状态检测。
背景与挑战
背景概述
SAM 40数据集是一个专注于通过脑电图(EEG)记录进行压力检测的公开数据集,其研究背景源于心理健康领域对压力监测的迫切需求。该数据集由研究人员在2021年发布,相关研究成果发表于《Scientific Data》期刊。数据集的核心研究问题是通过EEG信号分析,识别个体在不同任务(如算术测试)中的压力状态。SAM 40数据集为压力检测领域提供了高质量的多通道EEG数据,推动了基于生理信号的情绪识别和心理健康监测技术的发展。其影响力不仅体现在学术研究中,还为临床诊断和个性化健康管理提供了重要的数据支持。
当前挑战
SAM 40数据集在解决压力检测问题时面临多重挑战。首先,EEG信号具有高噪声和低信噪比的特性,如何有效去除眼动、肌电等伪迹干扰是数据处理的关键难点。其次,压力状态的界定具有主观性,标签的生成依赖于受试者的自我报告,可能存在偏差。此外,数据集构建过程中,研究人员需设计合理的实验范式以诱发压力状态,同时确保数据的多样性和代表性。在特征提取和分类阶段,如何从复杂的EEG信号中提取具有判别性的特征,并构建高效的分类模型,也是该领域的重要挑战。这些问题的解决需要跨学科的合作与创新方法的引入。
常用场景
经典使用场景
SAM 40数据集在脑电图(EEG)研究领域中被广泛应用于压力检测。通过记录受试者在进行算术测试时的脑电活动,该数据集为研究人员提供了一个标准化的平台,用于分析和分类不同压力水平下的脑电信号。其经典使用场景包括通过ICA滤波和频带特征提取技术,对脑电信号进行预处理和特征提取,进而利用机器学习算法进行分类。
解决学术问题
SAM 40数据集解决了脑电图信号处理中的多个关键学术问题。首先,它通过提供经过滤波和特征提取的脑电数据,帮助研究人员克服了信号噪声和伪影的干扰。其次,该数据集支持压力水平的二分类任务,为压力检测模型的开发提供了可靠的数据基础。此外,其标准化的数据处理流程为脑电图研究提供了可重复的实验框架,推动了该领域的科学进展。
实际应用
在实际应用中,SAM 40数据集被用于开发基于脑电图的压力检测系统。这些系统可应用于心理健康监测、工作场所压力管理以及驾驶员疲劳检测等领域。通过实时分析脑电信号,系统能够识别个体的压力状态,从而提供及时的干预或预警。此外,该数据集还可用于优化脑机接口技术,提升其在压力相关应用中的性能。
数据集最近研究
最新研究方向
近年来,基于脑电图(EEG)数据的压力检测研究逐渐成为神经科学和心理健康领域的热点。SAM 40数据集作为该领域的重要资源,提供了经过ICA滤波等多种预处理方法的EEG数据,支持从时域、频域以及非线性特征等多个维度进行压力分类分析。当前研究主要集中在利用机器学习算法,如KNN、SVM和MLP,结合时频特征提取技术,进一步提升压力检测的准确性和鲁棒性。此外,随着深度学习技术的快速发展,基于SAM 40数据集的端到端神经网络模型研究也逐渐兴起,为实时压力监测和个性化心理健康干预提供了新的可能性。这一方向不仅推动了脑机接口技术的发展,也为心理健康领域的精准医疗奠定了数据基础。
以上内容由遇见数据集搜集并总结生成



