EEG-FM-Bench

Name: EEG-FM-Bench
Creator: 同济大学
Published: 2025-08-25 15:34:33
License: 暂无描述

arXiv2025-08-25 更新2025-11-25 收录

下载链接：

https://github.com/xw1216/EEG-FM-Bench

下载链接

链接失效反馈

官方服务：

资源简介：

EEG-FM-Bench是一个全面的基准，用于系统地评估脑电图基础模型（EEGFMs）。该数据集由同济大学的研究人员创建，旨在解决脑电图分析中长期存在的挑战，如高个体间和个体内变异性、实验范式间的数据差异以及获取大规模、专家注释数据集的高成本。EEG-FM-Bench包括来自10个常见范式的14个公开数据集，涵盖了运动想象、睡眠分期、情绪识别、癫痫检测和阿尔茨海默病分类等领域。数据集大小、数据量、Tokens数等信息在论文中未提及。数据集创建过程包括任务和数据的精心策划、标准化数据处理流程和健壮的评价协议。该数据集的应用领域包括认知、情感和神经病理学等脑电图解码领域，旨在提高模型性能和泛化能力，促进科学进步。

EEG-FM-Bench is a comprehensive benchmark for systematically evaluating electroencephalography foundation models (EEGFMs). This dataset was developed by researchers from Tongji University to address long-standing challenges in EEG analysis, including high inter- and intra-individual variability, data discrepancies across experimental paradigms, and the high cost of acquiring large-scale expert-annotated datasets. EEG-FM-Bench includes 14 public datasets from 10 common paradigms, covering domains such as motor imagery, sleep staging, emotion recognition, epilepsy detection, and Alzheimer’s disease classification. Specific details such as dataset size, data volume, and number of Tokens are not mentioned in the paper. The dataset creation process involves meticulous curation of tasks and data, standardized data processing workflows, and a robust evaluation protocol. Its application fields span EEG decoding areas including cognition, emotion, and neuropathology, with the goal of improving model performance and generalization ability and promoting scientific advancement.

提供机构：

同济大学

创建时间：

2025-08-25

搜集汇总

数据集介绍

构建方式

在脑电信号分析领域，标准化评估框架的缺失阻碍了基础模型的系统性发展。EEG-FM-Bench通过整合14个公开数据集，覆盖运动想象、睡眠分期、情绪识别等10类经典范式，构建了首个综合性基准平台。其数据处理流程采用统一标准，包括通道选择、带通与陷波滤波、信号降采样至256Hz、固定时长分段及高效文件格式转换，确保数据一致性与可复现性。

特点

该数据集的核心特征在于其多维度的评估体系与神经科学启发的设计逻辑。通过设计三种微调策略——冻结主干网络单任务微调、全参数单任务微调及全参数多任务微调，系统化检验模型表征质量、适应性与跨范式泛化能力。数据集特别引入基于t-SNE的特征可视化和积分梯度归因分析，从定量与定性双维度揭示模型决策机制与神经生理学关联。

使用方法

研究者可通过开源框架调用标准化数据接口与评估模块，实现端到端的模型验证。使用流程涵盖数据加载、预处理流水线适配、多策略微调配置及多维指标分析。平台支持自定义数据集扩展与分布式训练优化，通过平衡准确率、加权F1、AUROC等鲁棒性指标，为不同任务场景提供可比性能评估。该框架显著降低了模型对比的工程门槛，推动脑电基础模型研究的可复现性与标准化进程。

背景与挑战

背景概述

脑电图基础模型作为神经科学领域的前沿研究方向，旨在通过大规模无标注数据学习稳健的脑信号表征。2025年由同济大学团队发布的EEG-FM-Bench作为首个系统性评估基准，整合了运动想象、睡眠分期、情绪识别等10类经典范式下的14个数据集，通过统一的开源框架解决了模型评估标准缺失的问题。该工作通过标准化数据处理流程与多任务评估策略，为跨范式泛化能力研究提供了重要基础设施，推动了脑机接口领域的可复现性发展。

当前挑战

当前脑电图基础模型面临双重挑战：在领域问题层面，模型需克服脑电信号固有的高个体差异性、低信噪比以及跨实验范式的数据分布偏移；在构建过程中，标准化评估框架的缺失导致模型比较困难，而预训练目标与下游任务间的语义鸿沟使得冻结表征的线性可分性严重不足。此外，多任务联合训练虽能提升泛化能力，但特定任务间存在的负迁移现象仍需通过神经先验融合与动态优化策略予以解决。

常用场景

经典使用场景

在脑电信号分析领域，EEG-FM-Bench作为首个综合性基准测试平台，为脑电基础模型的系统评估提供了标准化框架。该数据集整合了14个公开数据集，涵盖运动想象、睡眠分期、情绪识别、癫痫检测和阿尔茨海默病分类等10个经典脑电范式，通过统一的数据预处理流程和三种微调策略，实现了对模型预训练质量、架构设计和下游泛化能力的全面评估。

实际应用

在医疗诊断和脑机接口等实际场景中，EEG-FM-Bench通过多任务统一训练策略显著提升了模型的临床适用性。实验表明，采用全参数多任务微调的模型在癫痫检测、情绪识别等任务中表现出更强的知识迁移能力，其集成梯度可视化技术还能为医生提供神经生理学依据的决策解释，增强了模型在真实医疗环境中的可信度和可操作性。

衍生相关工作

该基准测试催生了一系列重要的衍生研究，包括对细粒度时空特征交互机制的深入探索。基于EEG-FM-Bench的实证分析，后续研究提出了融合神经心理学先验的架构设计，如CBraMod的交叉注意力机制和EEGPT的双自监督预训练策略。这些工作通过基准测试的量化比较，验证了神经启发式架构在提升模型泛化性能方面的显著优势。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集