five

State of Brain Emulation Report 2025

收藏
github2026-01-27 更新2026-01-29 收录
下载链接:
https://github.com/MxSchons-GmbH/sobe-2025-data-repository
下载链接
链接失效反馈
官方服务:
资源简介:
该仓库为2025年大脑仿真状态报告的数据仓库和可视化管道,包含神经模拟、神经记录、连接组学、计算需求、资金与倡议等多个领域的数据集。

This repository serves as the data warehouse and visualization pipeline for the 2025 Brain Simulation Status Report, housing datasets spanning multiple fields including neural simulations, neural recordings, connectomics, computational requirements, funding and initiatives.
创建时间:
2026-01-19
原始信息汇总

State of Brain Emulation Report 2025 数据集概述

数据集基本信息

  • 数据集名称:State of Brain Emulation Report 2025
  • 发布年份:2026年
  • 主要作者:Zanichelli, Nicola; Schons, Maximilian; Shiu, Patrick; Freeman, Ian; Arkhipov, Anton
  • 发布平台:Zenodo
  • 永久标识符:https://doi.org/10.5281/zenodo.18377594
  • 数据仓库地址:https://github.com/MxSchons-GmbH/sobe-2025-data-repository
  • 许可证:CC BY 4.0

数据集目的与范围

本数据仓库用于生成跟踪脑仿真研究进展的出版物质量图表,涵盖以下领域:

  • 神经模拟:从秀丽隐杆线虫(302个神经元)到人类规模模型(860亿个神经元)
  • 神经记录:跨生物体的记录技术进步
  • 连接组学:脑组织扫描和连接组重建
  • 计算需求:脑仿真所需的硬件和存储需求
  • 资助与倡议:全球脑研究项目及其预算

数据内容与结构

数据按主题组织,源数据采用TSV格式。

主要数据类别

类别 文件数量 描述
神经模拟 2 模拟神经元数量,1957-2025年
神经记录 3 按生物体划分的记录能力
连接组学 5 不同分辨率下的脑组织扫描
计算模型 2 模型复杂性和需求
成本 4 神经元重建成本、项目预算
倡议 1 全球脑研究项目
硬件 2 计算特性、存储成本
人工智能/计算 1 AI训练计算趋势

仓库目录结构

sobe-2025-data-repository/ ├── scripts/ # 图表生成代码 ├── data/ # 源数据集(TSV格式) │ ├── compute/ # AI训练、硬件数据 │ ├── connectomics/ # 脑扫描数据 │ ├── costs/ # 成本估算、大型项目 │ ├── formulas/ # 计算器公式 │ ├── imaging/ # 成像模式 │ ├── initiatives/ # 脑研究项目 │ ├── organisms/ # 生物体参考数据 │ ├── parameters/ # 共享计算参数 │ ├── recordings/ # 神经记录数据 │ ├── simulations/ # 模拟历史数据 │ ├── references/ # 集中参考文献(CSL-JSON格式) │ └── _metadata/ # 归属元数据(镜像data/结构) └── dist/ # 网站数据资产 ├── figures/ # 图表 ├── data/ # TSV数据集(镜像data/结构) ├── references/ # 参考文献供网络访问 └── downloads/ # 批量下载的ZIP存档

生成的图表

图表生成管道生成超过38张图表,涵盖以下类别:

概览图表

  • all-sim-rec - 神经模拟与记录综合图
  • num-neurons - 随时间变化的神经元数量比较
  • imaging-speed - 神经影像技术进展

计算相关

  • compute - 硬件趋势
  • gpu-memory - 单GPU内存与脑仿真需求对比
  • emulation-compute-* - 仿真计算需求
  • emulation-storage-requirements - 存储需求

生物体特定图表(位于子目录中)

  • neuro-sim/ - 按生物体划分的模拟进展
  • neuro-rec/ - 按生物体划分的记录能力
  • radar-charts/ - 能力比较雷达图

资助与倡议

  • funding - 研究资助趋势
  • initiatives* - 脑研究项目

所有图表均以SVG(矢量)和PNG(150 DPI)格式保存。

数据质量与归属

  • 数据质量状态:数据近期从多个来源转移和整合,质量控制和验证正在进行中,预计于2026年第一季度完成。
  • 归属结构data/目录中的所有数据文件在data/_metadata/中都有对应的元数据文件,镜像文件夹结构。
  • 元数据模式:每个.json元数据文件包含标题、来源、原始作者、贡献者、许可证、URL(仅外部数据)、访问日期(仅外部数据)和描述。

外部数据来源

数据集 原始作者 许可证
ai-training-computation.tsv Epoch via Our World in Data CC BY 4.0
storage-historical.tsv John C. McCallum via Our World in Data CC BY 4.0
neuroimaging-speed.tsv Carles Bosch MIT

参考文献管理

  • 参考文献库:以CSL-JSON格式存储在data/references/bibliography.json中(包含1,130多条参考文献)。
  • 参考列:参数和公式文件包含用于来源跟踪的列:ref_idsupporting_refsref_noteconfidencevalidated_by

使用方式

快速开始

bash git clone https://github.com/MxSchons-GmbH/sobe-2025-data-repository.git cd sobe-2025-data-repository python3 -m venv .venv source .venv/bin/activate pip install -r requirements.txt cd scripts python3 run_all_figures.py

主要依赖

  • matplotlib
  • seaborn
  • pandas
  • numpy
  • statsmodels
  • openpyxl
  • nbconvert
  • ipykernel

引用方式

文本引用

Zanichelli, N., Schons, M., Shiu, P., Freeman, I., & Arkhipov, A. (2026). State of Brain Emulation Report 2025 (Version 1). Zenodo. https://doi.org/10.5281/zenodo.18377594

BibTeX

bibtex @software{zanichelli2026sobe, author = {Zanichelli, Nicola and Schons, Maximilian and Shiu, Patrick and Freeman, Ian and Arkhipov, Anton}, title = {State of Brain Emulation Report 2025}, year = 2026, publisher = {Zenodo}, version = {1}, doi = {10.5281/zenodo.18377594}, url = {https://doi.org/10.5281/zenodo.18377594} }

搜集汇总
数据集介绍
main_image_url
构建方式
在脑科学与计算神经科学领域,构建一个全面反映脑仿真研究进展的数据集至关重要。State of Brain Emulation Report 2025 数据集通过系统整合多源异构数据构建而成,涵盖了从秀丽隐杆线虫到人类尺度的神经模拟、神经记录技术进展、连接组学扫描、计算硬件需求以及全球脑研究项目等多个维度。其构建过程遵循严谨的数据采集与标准化流程,原始数据以TSV格式存储,并辅以结构化的元数据文件进行溯源管理,确保了数据来源的可追溯性与一致性。
特点
该数据集的一个显著特点是其高度的系统性与可视化导向。它不仅提供了跨时间跨物种的定量数据,还配备了一套完整的自动化图表生成流水线,能够产出出版级质量的科学图表。数据集采用模块化架构,按主题分类存储,并嵌入了统一的视觉样式系统与色彩规范,保证了输出成果在学术传播中的专业性与美观度。此外,数据集附带了详尽的参考文献目录与数据质量说明,体现了对学术严谨性的追求。
使用方法
对于研究人员而言,该数据集的使用方法清晰而高效。用户可通过克隆代码仓库并配置Python虚拟环境,快速运行脚本以复现或生成全部图表。数据集的核心价值在于其可复现的分析流程,脚本能够直接读取TSV源数据,并应用预定义的样式生成SVG与PNG格式的图表。用户亦可基于提供的模块化代码与数据结构,进行定制化分析与可视化,或直接引用其整理好的数据与图表用于学术出版,使用时需遵循CC BY 4.0许可规范进行引用。
背景与挑战
背景概述
脑仿真研究作为神经科学与计算科学交叉的前沿领域,旨在通过计算模型精确复现生物大脑的结构与功能。State of Brain Emulation Report 2025数据集由Nicola Zanichelli、Maximilian Schons等研究人员于2026年发布,其核心研究问题聚焦于系统性追踪全球脑仿真技术的进展,涵盖从秀丽隐杆线虫到人类尺度的神经模拟、神经记录技术、连接组学重建、计算资源需求及科研资助态势等多个维度。该数据集通过整合多源异构数据并生成高质量可视化图表,为评估脑仿真领域的成熟度与发展轨迹提供了关键基准,对推动类脑计算、人工智能及神经工程等领域的协同创新具有重要影响力。
当前挑战
在解决脑仿真这一复杂领域问题时,数据集面临的核心挑战在于如何准确量化与比较跨物种、跨尺度的神经模拟与记录数据,同时需应对生物神经系统的高度异质性与动态性所带来的建模不确定性。在构建过程中,挑战主要体现为多源数据的整合与标准化,包括历史文献数据、实验记录及硬件性能指标的清洗与对齐;此外,确保数据质量的一致性及持续验证亦是一项艰巨任务,需建立完善的元数据管理与溯源机制以支撑研究的可重复性。
常用场景
经典使用场景
在脑科学与计算神经科学领域,该数据集常被用于追踪脑仿真研究的进展趋势。研究者通过其提供的神经模拟、神经记录、连接组学及计算需求等多维度时序数据,绘制高质量图表,直观展示从秀丽隐杆线虫到人类大脑的仿真规模演变,从而评估技术发展的关键节点与瓶颈。
衍生相关工作
围绕该数据集衍生的经典工作主要包括基于其可视化框架的进展综述与元分析研究。例如,多个团队利用其生成的图表与标准化数据,发表了关于脑仿真技术路线图的评估报告;同时,其结构化的元数据与参考文献系统也为后续构建更复杂的脑仿真知识图谱与预测模型提供了核心数据源。
数据集最近研究
最新研究方向
在脑科学与计算神经工程领域,脑仿真研究正以前所未有的速度推进,其前沿方向聚焦于跨尺度神经模拟与高精度连接组学重建的融合。当前研究热点围绕人脑规模仿真展开,涉及860亿神经元级别的全脑动态建模,这得益于神经记录技术的突破与计算硬件的指数级增长。全球范围内的大型脑计划,如欧盟人脑计划与美国脑计划,持续注入资金与资源,推动着多模态成像与实时仿真算法的协同发展。这一趋势不仅深化了对意识与认知机制的探索,也为类脑智能与神经形态计算提供了关键数据基础,预示着在疾病治疗与人工智能领域产生深远影响。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作