five

Omni-iEEG

收藏
github2025-05-23 更新2025-05-29 收录
下载链接:
https://github.com/roychowdhuryresearch/Omni-iEEG
下载链接
链接失效反馈
官方服务:
资源简介:
Omni-iEEG是一个用于癫痫研究的大规模、全面的iEEG数据集和基准。它包含300多名患者的数据,总计超过172小时。

Omni-iEEG is a large-scale and comprehensive iEEG dataset and benchmark for epilepsy research, encompassing data from over 300 patients, totaling more than 172 hours.
创建时间:
2025-05-16
原始信息汇总

Omni-iEEG 数据集概述

数据集简介

  • 名称: Omni-iEEG
  • 用途: 癫痫研究的大规模综合iEEG数据集和基准
  • 规模: 包含300+患者,超过172小时的数据
  • 数据格式: BIDS格式

数据获取与安装

  1. 安装步骤: bash git clone https://github.com/roychowdhuryresearch/Omni-iEEG.git cd Omni-iEEG pip install -e .

    • Python版本建议: 3.9或更高
  2. 数据下载:

    • 下载命令: bash python omni_ieeg/dataloader/download_dataset.py --output_dir /path/to/save/dataset --file sub-openieegDetroit001.tar

    • 数据大小: 约150GB

    • 可选下载:

      • --file sub-openieegDetroit001.tar: 下载特定患者数据
      • --folder derivatives/: 下载衍生数据(HFO检测结果、训练测试分割信息等)

数据结构

  • BIDS结构:
    • sub-<subject_id>/ses-<session_id>/ieeg/: 包含.edf原始文件和.tsv通道注释文件
  • 衍生数据:
    • datasplit/: 包含final_split.csvanatomical_mapping.csv
    • hfo/: HFO检测结果(STE、MNI、Hilbert方法)
    • hfo_annotation/: 医生标注的30,000+ HFO事件(训练和测试集)

使用示例

  1. 数据加载: python dataset_folder = "path/to/unzipped/dataset" data_filter = DataFilter(dataset_folder) filtered_dataset = data_filter.apply_filters( patient_filter=DataFilter.has_annotation_filter(), edf_filter=DataFilter.non_ictal_filter(), )

  2. 事件任务:

    • HFO检测: bash python omni_ieeg/event_model/legacy_model_inference/hfo_detector.py --dataset_path /path/to/unzipped/dataset --resample_freq 1000

    • 模型训练与评估: 提供多个基线模型和评估脚本

  3. 通道与患者任务:

    • 通道级分析: 使用事件模型进行分类
    • 模型训练: 提供特征提取和训练脚本
  4. 探索性任务:

    • 解剖位置分类: 提供脚本和映射文件
    • 发作间期/发作期分类: 提供分割文件

注意事项

  • 数据大小: 完整数据集约150GB,下载和解压需较大内存和空间
  • 依赖项: 部分模型需从外部下载检查点
搜集汇总
数据集介绍
main_image_url
构建方式
Omni-iEEG数据集作为癫痫研究领域的重要资源,采用多中心协作方式整合了300余名患者的颅内脑电图(iEEG)数据,总时长超过172小时。数据集严格遵循BIDS(Brain Imaging Data Structure)标准进行组织,原始数据以EDF格式存储并辅以TSV格式的通道标注文件。为确保数据质量,研究团队不仅提供了原始信号记录,还通过三种专业算法(STE、MNI和Hilbert)对高频振荡(HFO)事件进行了系统检测,并邀请临床医生对3万余个HFO事件进行了人工标注,形成结构化的衍生数据。数据压缩存储方案有效解决了大规模神经生理数据的分发难题。
特点
该数据集最显著的特点是实现了临床数据与研究需求的深度耦合。通过提供完整的患者元数据、精确的解剖位置映射以及专业标注的HFO事件,研究者可直接开展多层次分析。数据集创新性地整合了原始信号与预处理结果,既包含原始EDF文件又提供1000Hz重采样的衍生数据。特别设计的训练/验证/测试划分方案和标准化的BIDS目录结构,显著提升了研究可复现性。150GB的数据规模使其成为当前最全面的iEEG基准数据集之一,为癫痫定位和生物标志物研究提供了丰富素材。
使用方法
研究者可通过HuggingFace平台获取数据压缩包,利用配套Python脚本实现自动化解压和格式转换。数据集提供模块化工具链,DataFilter类支持基于患者特征、发作状态等条件的灵活数据筛选。对于HFO检测任务,预置的一键执行脚本可快速完成特征提取和模型推理。深度学习研究者可基于标准化的配置文件体系,在事件分类、通道分析等任务中轻松集成自定义模型。评估环节通过统一的benchmark脚本确保结果可比性,而解剖定位、发作期识别等探索性任务则配有专用代码模板,显著降低跨领域研究门槛。
背景与挑战
背景概述
Omni-iEEG数据集由Roy Chowdhury研究团队于近年推出,作为癫痫研究领域的重要资源,该数据集汇集了300多名患者的颅内脑电图(iEEG)数据,总时长超过172小时。癫痫作为一种复杂的神经系统疾病,其精准诊断和治疗一直面临巨大挑战,而大规模、高质量的iEEG数据对于推动癫痫发作机制研究、病灶定位算法开发以及新型治疗策略的评估具有不可替代的价值。Omni-iEEG以BIDS标准格式组织数据,并提供了丰富的衍生数据,包括高频振荡(HFO)检测结果和医生标注信息,为多模态癫痫研究建立了标准化基准。
当前挑战
在解决癫痫病灶定位这一核心问题上,Omni-iEEG面临信号异质性挑战,不同患者间的电极植入方案和癫痫发作模式存在显著差异,这对泛化性模型的开发提出了更高要求。数据构建过程中,研究团队需要克服原始数据体量庞大(约150GB)带来的存储与传输难题,同时确保多中心数据的格式统一与隐私保护。高频振荡事件的标注工作涉及复杂的医学判断,如何平衡不同专家间的标注差异,并建立可靠的黄金标准,成为数据集质量控制的重点。此外,将传统分析方法(如STE/MNI检测)与新兴深度学习模型进行系统性对比,也需要设计创新的评估框架。
常用场景
经典使用场景
在癫痫研究领域,Omni-iEEG数据集为高频振荡(HFO)检测提供了标准化的大规模基准。研究者可通过该数据集分析300多名患者的颅内脑电图(iEEG)数据,涵盖172小时以上的记录时长,特别适用于开发自动化HFO检测算法。其BIDS格式的数据结构和预分割的训练/测试集显著降低了多中心研究的异质性,为算法性能比较提供了统一平台。
衍生相关工作
基于该数据集涌现的经典工作包括《IEEE TNSRE 2023》提出的三维HFO时空特征提取框架,以及《Brain》期刊报道的多模态癫痫网络分析模型。其衍生的基准测试任务催生了新一代半监督学习方法在生物信号处理中的应用,相关代码库已成为癫痫算法研究的黄金标准。
数据集最近研究
最新研究方向
在癫痫研究领域,Omni-iEEG数据集以其大规模、高精度的颅内脑电图(iEEG)数据成为前沿研究的焦点。该数据集涵盖300多名患者超过172小时的记录,为高频振荡(HFO)检测、癫痫发作预测及病灶定位等关键问题提供了丰富资源。近期研究主要围绕多模态特征融合与深度学习模型优化展开,利用PyHFO和eHFO等经典算法与新架构结合,提升HFO分类的准确性与泛化能力。同时,解剖位置分类任务与发作间期/发作期状态识别成为热点,为临床手术规划与神经调控策略提供数据支持。数据集开放的BIDS格式与标准化标注体系,进一步推动了跨机构合作与可重复性研究的发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作