five

SingLEM数据集

收藏
arXiv2025-09-22 更新2025-11-21 收录
下载链接:
https://github.com/ttlabtuat/SingLEM
下载链接
链接失效反馈
官方服务:
资源简介:
SingLEM数据集是由东京农业大学电子与信息工程系的研究团队创建的,旨在学习单通道脑电图(EEG)的通用表示。该数据集包含超过9,200名受试者和超过357,000小时的单一通道EEG记录。SingLEM数据集通过自监督学习预训练,能够在不同的蒙太奇设置中实现泛化,并能够用于多种下游任务,如运动想象和认知任务分类。

The SingLEM dataset was developed by a research team from the Department of Electronics and Information Engineering, Tokyo University of Agriculture, to learn general representations for single-channel electroencephalogram (EEG). This dataset includes over 9,200 subjects and more than 357,000 hours of single-channel EEG recordings. Pre-trained via self-supervised learning, the SingLEM dataset can generalize across different montage settings and be applied to multiple downstream tasks such as motor imagery and cognitive task classification.
提供机构:
东京农业大学电子与信息工程系
创建时间:
2025-09-22
搜集汇总
数据集介绍
main_image_url
构建方式
在脑电信号分析领域,SingLEM数据集采用创新的单通道建模策略构建而成。该数据集整合了71个公开脑电数据集,涵盖9,200余名受试者的多通道记录,通过标准化预处理流程将原始信号转换为单通道格式。具体构建过程包括带通滤波、工频陷波、重采样至128Hz等步骤,最终形成超过357,000小时的单通道脑电数据。这种独特的构建方式突破了传统多通道模型对固定电极布局的依赖,实现了硬件无关的脑电表征学习。
特点
该数据集最显著的特征在于其单通道基础模型的创新设计。通过非对称掩码自编码器架构,模型融合了卷积层的局部特征提取能力与分层变换器的长程时序依赖建模优势。数据集覆盖了运动想象、认知任务等多种实验范式,展现出卓越的跨任务泛化性能。特别值得注意的是,单通道处理机制使得模型能够适应不同电极配置和缺失通道场景,为脑机接口的实用化部署提供了重要支撑。
使用方法
在实际应用场景中,SingLEM数据集可作为预训练特征提取器直接服务于下游任务。用户无需进行任务特定的微调,仅需将单通道脑电信号输入预训练模型,即可获得高质量的时序表征。这些表征可通过简单拼接形成多通道特征,再结合轻量级分类器实现高效解码。该使用方法显著降低了计算资源需求,同时保持了优异的分类性能,特别适用于数据稀缺和硬件受限的脑电分析场景。
背景与挑战
背景概述
SingLEM数据集由东京农工大学研究团队于2025年创建,旨在解决脑电图分析中传统深度学习模型对固定多通道电极布局的依赖性问题。该数据集整合了71个公开EEG数据集,涵盖超过9,200名受试者和357,000小时的单通道脑电记录,通过自监督预训练构建硬件无关的基础模型。其核心研究在于探索单通道脑电信号的通用表征学习,显著提升了模型在异构硬件配置和低通道场景下的适应能力,为脑机接口和神经生理学研究提供了新的范式。
当前挑战
在脑电图分析领域,SingLEM致力于克服多通道基础模型对固定电极布局的刚性依赖,解决跨数据集通用性和低通道应用的瓶颈。构建过程中面临三大挑战:首先需统一来自不同采集设备、采样率和电极配置的异构数据;其次要设计能同时捕捉局部特征与长程时序依赖的混合编码架构;最后需通过大规模自监督预训练确保单通道表征在运动想象、认知任务等多样化场景中的鲁棒性。
常用场景
经典使用场景
在脑机接口与神经科学研究中,SingLEM数据集通过单通道脑电信号建模,为跨设备、跨范式场景提供了通用表征基础。其核心应用聚焦于运动想象与认知任务解码,例如通过独立分析各电极信号实现精准的左右手运动意图分类,或基于前额叶通道特征识别工作记忆负荷差异。这种单通道处理范式有效克服了传统多通道模型对固定电极布局的依赖,使得在低通道配置的便携设备中也能保持卓越性能。
衍生相关工作
该数据集催生了面向单通道脑电的预训练架构创新,例如基于掩码自编码器的层次化Transformer设计。其表征学习方法启发了后续研究探索跨模态迁移,如将EEG特征与fNIRS信号融合的工作。在应用层面,衍生出基于通道重要性权重的动态融合策略,以及针对少数通道的元学习框架。这些进展共同推动了脑电分析从固定范式向自适应、可解释方向的演进,为新一代通用脑模型奠定基础。
数据集最近研究
最新研究方向
在脑电信号分析领域,SingLEM数据集的推出标志着单通道基础模型研究的前沿突破。该模型通过自监督学习架构,在71个公开数据集上预训练超过35万小时单通道脑电数据,突破了传统多通道模型对固定电极布局的依赖。当前研究聚焦于硬件无关的脑机接口应用,通过局部特征提取与分层Transformer的混合编码器,在运动想象与认知任务中展现出卓越的泛化能力。这一技术路径为临床康复、消费级脑电设备提供了可扩展解决方案,同时通过通道级表征实现了神经活动空间分布的可视化分析,推动了脑电解码范式从硬件适配到通用表征的根本性转变。
相关研究论文
  • 1
    通过东京农业大学电子与信息工程系 · 2025年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作