IBL-ephys-data
收藏github2026-02-21 更新2026-02-28 收录
下载链接:
https://github.com/gptabhinav/IBL-ephys-data
下载链接
链接失效反馈官方服务:
资源简介:
IBL提供了两个不同的数据集:1. reproducible ephys data(用于LFP2Vec论文),该数据集在近似相同的位置进行了探针插入,旨在验证在不同实验设置下能否产生可重复的质量实验和结果;2. brainwide map data,该数据集有更多的插入点,但需要预处理和质量控制才能使用。
IBL provides two distinct datasets: 1. Reproducible ephys data (for the LFP2Vec paper): Probe insertions for this dataset are performed at approximately identical locations, with the aim of verifying whether reproducible high-quality experiments and results can be generated across different experimental setups; 2. Brainwide map data: This dataset features a greater number of insertion sites, but requires preprocessing and quality control for proper usage.
创建时间:
2026-02-03
原始信息汇总
IBL-ephys-data 数据集概述
数据集来源
- 数据提供方:International Brain Laboratory (IBL)
- 数据集存储库地址:https://github.com/gptabhinav/IBL-ephys-data
数据集构成
该代码库主要处理两个来自IBL的电生理数据集:
-
可重复电生理数据 (reproducible ephys data)
- 用途:曾被用于LFP2Vec论文。
- 特点:探针插入位置大致相同,旨在验证跨多个实验室设置的实验和结果的可重复性。
- 对本项目的价值:由于涉及脑区较少,不适合用于模型训练,但可用于对训练好的模型进行零样本测试。
-
全脑图谱数据 (brainwide map data)
- 特点:包含更多的探针插入位点。
- 使用前处理:需要进行预处理和质量控制(QC)才能使用。
- 预处理建议:遵循论文《Spike sorting pipeline for the International Brain Laboratory》中的步骤。
- QC建议:参考
static/tianxiao_suggestions.png中的方案,但需要更稳健和可扩展的文档化流程。
数据内容与获取
-
核心数据:通过
SpikeSortingLoader获取的通道数据,包含探针插入的xyz坐标、脑区信息和标签信息。 -
数据下载工具:
downloader.py脚本。 -
下载命令示例: bash python downloader.py python downloader.py --input_csv data/reproducible_ephys/ibl_reproducible_ephys_pids.csv --dataset reproducible_ephys
-
输出文件:
output/ibl_channel_data.csv(默认)output/ibl/<dataset>/channels.csv(当指定--dataset参数时)
数据可视化
- 可视化工具:
visualize.py脚本。 - 支持的数据供应商与数据集:
- 供应商:
ibl,allen - 数据集:
brainwide_map,reproducible_ephys(对应IBL供应商),allen(对应Allen供应商)
- 供应商:
- 可视化命令示例: bash python visualize.py --vendor ibl --dataset reproducible_ephys python visualize.py --vendor ibl --dataset reproducible_ephys --vendor ibl --dataset brainwide_map --vendor allen --dataset allen
坐标转换
- 需要将IBL坐标系转换为Allen脑图谱坐标系,以便与brainrender库或Allen数据集兼容。
数据验证与参考
- 可视化验证网站:https://viz.internationalbrainlab.org/app?spikesorting=ss_2024-05-06
- 可在“repeated sites”和“original”标签下查看可重复电生理数据相关的实验。
- 支持使用
eid:"eid"或pid:"pid"进行搜索。
- 可重复电生理数据可视化示例:

官方文档与论文
- IBL电生理数据文档:https://docs.internationalbrainlab.org/notebooks_external/2024_data_release_repro_ephys.html
- IBL电生理数据论文:https://doi.org/10.1101/2022.05.09.491042
- IBL全脑图谱数据文档:https://docs.internationalbrainlab.org/notebooks_external/2025_data_release_brainwidemap.html
- IBL全脑图谱数据论文:https://doi.org/10.6084/m9.figshare.21400815
- ONE API数据下载指南:https://docs.internationalbrainlab.org/notebooks_external/data_download.html#Explore-and-download-data-using-the-ONE-api
- SpikeSortingLoader API文档:https://docs.internationalbrainlab.org/_autosummary/brainbox.io.one.html#brainbox.io.one.SpikeSortingLoader
搜集汇总
数据集介绍
构建方式
在神经科学领域,国际脑实验室(IBL)致力于通过标准化实验流程构建高质量的电生理数据集。IBL-ephys-data的构建依托于多实验室协作框架,采用统一的探针植入方案与数据采集协议,确保实验的可重复性与数据一致性。数据集涵盖reproducible_ephys与brainwide_map两个子集,前者聚焦于验证跨实验室的可重复性,后者则通过广泛脑区采样构建全脑尺度映射。数据采集过程中,研究者遵循严格的预处理流程,包括信号滤波、尖峰排序及坐标转换,最终形成包含通道坐标、脑区标签及信号特征的标准化数据矩阵。
特点
该数据集的核心特征在于其多层次结构与标准化注释体系。reproducible_ephys子集强调实验可重复性,探针植入位置高度一致,适用于方法学验证与零样本测试;brainwide_map子集则覆盖广泛脑区,提供丰富的空间采样信息,支持全脑尺度神经网络建模。数据集整合了探针通道的三维坐标、脑区解剖标签及信号质量指标,并兼容IBL与Allen脑图谱坐标系统,便于跨平台数据融合。此外,数据集附带可视化工具与质量评估指南,为神经信号分析提供端到端支持。
使用方法
使用该数据集需通过Python脚本与IBL的ONE API接口进行交互。用户可通过downloader.py脚本指定输入CSV文件(需包含pid与eid字段)下载通道数据,输出格式为标准化CSV表格。数据可视化通过visualize.py实现,支持多数据集(如reproducible_ephys、brainwide_map)的并行渲染与对比分析。对于高级应用,建议参照IBL官方文档中的SpikeSortingLoader模块提取通道坐标与区域信息,并依据相关论文的预处理流程进行信号质量控制。数据集可直接用于电生理信号分类、脑区映射模型训练或跨平台神经数据分析。
背景与挑战
背景概述
国际脑实验室(International Brain Laboratory, IBL)于2022年发布了IBL-ephys-data数据集,该数据集旨在系统性地探究神经科学中电生理实验的可重复性与全脑尺度下的神经活动映射。数据集由国际脑实验室联盟的研究人员主导构建,核心研究问题聚焦于跨实验室环境下电生理记录的一致性与可靠性,以及在全脑范围内解析神经回路的空间分布与功能特性。该数据集通过标准化实验流程与数据采集规范,为神经科学领域提供了高质量、可公开访问的大规模电生理资源,显著推动了计算神经科学与系统神经科学的研究进展,尤其在神经编码、脑图谱构建及机器学习模型验证等方面具有重要影响力。
当前挑战
IBL-ephys-data数据集所解决的领域问题在于电生理数据的标准化与全脑神经活动的高精度映射,其挑战体现在两方面:在科学层面,数据集需克服跨实验室实验条件差异导致的记录信号变异,确保电生理数据的可重复性与可比性;在技术层面,构建过程中面临大规模神经信号数据的预处理复杂性,包括探针轨迹的空间坐标转换、脑区标注的准确性验证,以及数据质量控制(QC)流程的标准化与自动化需求。此外,数据集整合了可重复电生理与全脑图谱两个子集,后者需依赖严格的预处理流程与稳健的质量评估方法,以保障数据在机器学习模型训练与零样本预测中的有效应用。
常用场景
经典使用场景
在系统神经科学领域,IBL-ephys-data数据集为探究大脑神经活动提供了关键实验数据支撑。该数据集最经典的使用场景在于支持跨实验室的可重复电生理研究,研究人员利用其记录的探针插入位置与神经信号数据,验证在不同实验设置下神经科学实验的可重复性与一致性。通过分析多只动物在相似脑区插入探针所获取的稳定电生理记录,该数据集为评估实验方法的鲁棒性提供了标准化基准。
实际应用
在实际应用层面,IBL-ephys-data数据集为开发新型神经信号分析算法与计算模型提供了关键训练与验证资源。例如,在LFP2Vec等工作中,研究人员利用该数据集的可重复电生理数据训练模型,进而评估其在未见脑区上的零样本预测能力。此外,其全脑图谱数据经过预处理与质量控制后,可用于构建大规模脑功能图谱,支持脑机接口、神经疾病机理探索等前沿应用。
衍生相关工作
围绕IBL-ephys-data数据集,已衍生出多项经典研究工作。其中,LFP2Vec论文利用其可重复电生理数据探索局部场电位信号的向量化表示学习。同时,国际脑实验室团队基于该数据集发布了全脑图谱数据,推动了大规模神经编码与脑区间连接研究。相关预处理流程如Spike sorting pipeline的标准化,也为后续神经信号分析工作提供了重要方法学参考。
以上内容由遇见数据集搜集并总结生成



