SWEC_iEEG_Dataset
收藏Hugging Face2025-08-15 更新2025-08-16 收录
下载链接:
https://huggingface.co/datasets/NeuroTec/SWEC_iEEG_Dataset
下载链接
链接失效反馈官方服务:
资源简介:
SWEC iEEG数据集是一个包含68位药物难治性癫痫患者术前评估的完整匿名化多通道脑电记录。该数据集由瑞士伯尔尼大学神经学系的睡眠觉醒癫痫中心(SWEC)收集,包含9328小时的信号和704次癫痫发作事件,并由癫痫病学专家进行了详细注释。
The SWEC iEEG dataset consists of complete anonymized multichannel electroencephalogram (EEG) recordings obtained during presurgical evaluations for 68 patients with drug-resistant epilepsy. Collected by the Sleep-Wake Epilepsy Center (SWEC) of the Department of Neurology at the University of Bern, Switzerland, the dataset encompasses 9,328 hours of neural signals and 704 seizure events, which were meticulously annotated by epileptologists.
创建时间:
2025-08-14
原始信息汇总
SWEC iEEG 数据集概述
数据集基本信息
- 名称: SWEC iEEG Dataset
- 许可证: CDLA Permissive 2.0
- 标签: medical, biology, ieeg, seizure, epilepsy
- 数据集大小: 4.6TB(压缩后)
- 记录时长: 9328小时
- 发作事件数: 704次
- 样本数: 68名受试者
数据集结构
-
文件数量: 696个文件(68个文件夹)
-
文件格式: HDF5
-
结构示例:
|-- ID04 | |-- ID04_part_1.h5 | |-- ID04_part_2.h5 | |-- ID04_total.h5
数据记录
- 数据路径:
data/ieeg(部分文件或总文件) - 推荐访问方式: 通过total文件访问
- 数据形状:
(C, T) - 数据压缩:
lz4hc - 采样率: 512Hz或1024Hz
标注信息
- 标注路径:
data/seizures(总文件中) - 标注字段:
onsets(发作起始时间),offsets(发作结束时间) - 时间单位: 秒
文件完整性
- 校验信息:
info/files(部分文件名列表),info/checksums(BLAKE2b校验和)
其他属性
- 文件属性:
patient(患者ID),channels(通道数),sampling_rate(采样率)
数据预处理
- 信号处理: 16位模数转换,视觉检查去除伪迹通道,0.5-150Hz带通滤波,下采样至512Hz或1024Hz
伦理考虑
- 知情同意: 所有受试者签署书面知情同意书
- 临床独立性: 数据收集与临床决策完全独立
数据集来源
- 记录地点: 瑞士伯尔尼Inselspital医院神经内科SWEC中心
- 数据标注: Kaspar Schindler教授(认证癫痫学家)
数据集维护
- 维护团队: Kaspar Schindler, Francesco Carzaniga, Abbas Rahimi及SWEC团队
初始版本
- 初始版本: 包含18名受试者(已过时,可能随时不可用)
使用限制
- 用途限制: 仅限研究使用,禁止用于诊断
引用信息
bibtex @article{carzaniga2025foundation, title={A foundation model with multi-variate parallel attention to generate neuronal activity}, author={Carzaniga, Francesco and Hersche, Michael and Sebastian, Abu and Schindler, Kaspar and Rahimi, Abbas}, journal={arXiv preprint arXiv:2506.20354}, year={2025} }
联系方式
- 联系人: Francesco Carzaniga (frc@zurich.ibm.com)
搜集汇总
数据集介绍

构建方式
SWEC iEEG数据集构建于癫痫诊疗领域的前沿研究需求,采用严谨的临床数据采集流程。该数据集收录了来自瑞士伯尔尼大学医院癫痫中心68名耐药性癫痫患者的颅内脑电图记录,所有数据均经过严格的匿名化处理。原始信号通过16位模数转换后,研究人员采用四阶巴特沃斯前后向滤波器进行0.5-150Hz带通滤波,并降采样至512Hz或1024Hz。每例患者数据被划分为约10GB大小的HDF5分块文件,并通过虚拟数据集技术整合为连续记录,同时保留了由专业癫痫学家标注的704次发作事件。
特点
该数据集在神经电生理研究领域具有显著特色,其多通道颅内记录总时长达到9328小时,为癫痫发作模式分析提供了丰富样本。数据采用LZ4HC高效压缩存储,以3分钟为单位的信号块优化了随机访问性能。每份文件均包含患者ID、通道数和采样率等元数据,并通过blake2b校验机制确保数据完整性。特别值得注意的是,数据集采用分层结构组织,每个患者文件夹包含分块文件和整合后的虚拟数据集,便于不同规模的研究需求。
使用方法
研究者可通过HDF5格式访问该数据集,推荐使用整合后的虚拟数据集文件进行统一操作。信号数据存储于'data/ieeg'路径下,采用(C,T)维度的数组结构,而发作标注信息则保存在'data/seizures'结构数组中,包含发作起始和结束时间戳。使用前需配置h5py和hdf5plugin库以支持LZ4HC解压缩。为保障研究伦理合规,该数据集严格限定于科研用途,禁止用于临床诊断。引用时需遵循CDLA-Permissive 2.0许可协议,并标注相关arXiv预印本论文。
背景与挑战
背景概述
SWEC iEEG数据集由瑞士伯尔尼大学医院神经内科睡眠-觉醒癫痫中心(SWEC)的Kaspar Schindler教授团队创建,旨在为药物难治性癫痫的术前评估研究提供高质量颅内脑电图数据资源。该数据集收录了68名患者的9328小时多通道iEEG信号及704次发作事件标注,采用HDF5 VDS格式实现海量数据的虚拟连续存储。作为癫痫发作预测领域的重要基准数据集,其通过严格的信号预处理流程(包括16位模数转换、人工伪迹剔除、巴特沃斯滤波等)确保了数据质量,为探索癫痫发作的生物标志物和开发新型预测算法奠定了坚实基础。
当前挑战
该数据集面临的领域挑战主要体现在癫痫发作预测这一高度复杂的时序分类问题上,包括发作间期与发作期脑电模式的非线性动态变化、个体间神经生理特征的显著差异,以及罕见事件导致的类别不平衡问题。在数据构建层面,技术挑战涉及多中心采集设备的异构性协调、长达数千小时连续信号的质量控制、临床专家标注一致性的保障,以及4.6TB原始数据的高效存储与访问优化。特别值得注意的是,颅内电极信号易受运动伪迹和硬件噪声干扰,如何在不损失生物信息的前提下实现有效的信号去噪成为关键预处理难题。
常用场景
经典使用场景
在癫痫研究领域,SWEC iEEG数据集为探索癫痫发作的神经机制提供了重要资源。该数据集的多通道颅内脑电图记录覆盖了68名耐药性癫痫患者的9328小时信号数据,特别适合用于癫痫发作预测模型的训练与验证。研究人员可通过分析704次标注的发作事件,深入理解癫痫发作前、中、后期的神经电活动特征。
衍生相关工作
该数据集催生了多项里程碑式研究,包括基于多变量并行注意力机制的癫痫预测模型(MVPFormer)。相关成果发表在《arXiv》等平台,推动了时空特征联合建模方法的发展。后续研究进一步拓展了其在神经调控闭环系统中的应用,为智能神经假体开发奠定基础。
数据集最近研究
最新研究方向
近年来,随着深度学习技术在医学信号处理领域的广泛应用,SWEC_iEEG_Dataset作为癫痫研究领域的重要资源,正逐渐成为神经科学和人工智能交叉研究的热点。该数据集包含68名耐药性癫痫患者的颅内脑电图(iEEG)记录,总计9328小时的信号数据和704次癫痫发作事件,为癫痫发作预测和检测算法的开发提供了丰富的训练和验证素材。前沿研究主要聚焦于多变量并行注意力机制的开发,如MVPFormer等模型的应用,旨在提升癫痫发作预测的准确性和实时性。此外,该数据集还被用于探索癫痫发作的神经机制,以及开发个性化的治疗策略。数据集的高质量和详细注释为研究人员提供了可靠的基础,推动了癫痫诊疗技术的进步。
以上内容由遇见数据集搜集并总结生成



