NeuroPaint

Name: NeuroPaint
Creator: 哥伦比亚大学
Published: 2025-10-14 04:45:06
License: 暂无描述

arXiv2025-10-14 更新2025-10-16 收录

下载链接：

https://github.com/NeuroPaint

下载链接

链接失效反馈

官方服务：

资源简介：

NeuroPaint是一个基于Transformer的掩码自动编码方法，用于推断未记录大脑区域的活动动态。通过在具有重叠记录区域的多动物数据集上训练，NeuroPaint学习根据个体间的共享结构重建缺失区域的活动。该数据集由哥伦比亚大学的研究团队创建，旨在解决如何利用多动物数据集更好地理解多区域相互作用的问题。

NeuroPaint is a Transformer-based masked autoencoding method designed to infer the activity dynamics of unrecorded brain regions. Trained on multi-animal datasets with overlapping recorded brain regions, NeuroPaint learns to reconstruct the activity of missing regions based on the shared inter-individual structure across subjects. This dataset was created by the research team at Columbia University, aiming to address the challenge of better understanding multi-region interactions by leveraging multi-animal datasets.

提供机构：

哥伦比亚大学

创建时间：

2025-10-14

搜集汇总

数据集介绍

构建方式

在系统神经科学领域，多脑区记录技术的快速发展为研究跨脑区交互提供了前所未有的机遇。NeuroPaint数据集采用掩码自编码框架构建，通过整合多动物实验中部分重叠的脑区记录数据，将未记录脑区视为推理过程中的掩码区域。该架构包含跨注意力缝合模块、令牌化器、Transformer编码器和广义线性读出器，在训练过程中随机掩蔽60%以内的记录脑区活动，迫使模型学习跨动物共享的神经动态结构，从而实现对缺失脑区活动的重建。

特点

该数据集的核心特征在于其创新的跨动物建模范式，能够利用解剖结构的跨个体一致性推断未记录脑区的神经动态。通过专门的脑区特定潜在因子设计，模型不仅保持了对记录脑区活动的高保真重建能力，还实现了对未记录脑区动态的精确推断。数据集涵盖合成数据和真实Neuropixels记录，包含国际脑实验室和介观活动计划两大实验项目的数据，确保了数据来源的多样性和生物学真实性。其潜在因子展现出跨试次一致性和行为情境依赖性，为研究任务相关的神经计算提供了丰富信息。

使用方法

在实践应用中，该数据集支持通过监督式广义线性模型评估推断潜在因子的预测能力。研究人员首先利用NeuroPaint模型训练获得各脑区的潜在因子表示，随后在测试阶段使用这些因子预测保留脑区的神经活动。评估指标采用偏差分数解释，量化模型对单神经元发放率的预测准确性。该方法不仅适用于合成数据中已知真实发放率的验证场景，更能有效处理真实神经数据中低发放率、稀疏调制的挑战性条件，为跨脑区神经动态分析提供了可靠工具。

背景与挑战

背景概述

NeuroPaint数据集由哥伦比亚大学理论神经科学中心主导，联合洛桑联邦理工学院等机构于2025年提出，旨在解决系统神经科学中多脑区交互研究的核心难题。该数据集通过整合多动物神经像素记录数据，构建了首个能够推断未记录脑区动态的生成模型，突破了传统方法受限于单次实验记录范围的瓶颈。其创新性在于利用跨动物共享的解剖结构，通过掩码自编码技术实现全脑尺度动态重建，为研究记忆引导行为等复杂认知过程提供了前所未有的分析维度。

当前挑战

该数据集主要面临双重挑战：在领域问题层面，需解决多脑区动态交互建模中因记录覆盖不全导致的信息缺失问题，传统方法如DLAG或LFADS无法推断未记录脑区的神经活动；在构建过程中，需克服跨动物数据对齐的复杂性，包括神经活动时空异质性、记录会话间脑区覆盖差异，以及掩码训练策略下保持潜在因子一致性的技术难点。此外，Transformer架构的二次计算复杂度限制了模型向数百个脑区扩展的可行性。

常用场景

经典使用场景

在系统神经科学领域，NeuroPaint数据集为多动物多脑区记录分析提供了关键工具。该数据集最经典的使用场景在于通过跨动物训练模型，从部分记录的脑区活动中推断未记录脑区的神经动力学。研究人员利用其掩码自编码架构，在多个实验会话中随机掩码已记录脑区并训练模型重建其活动，从而实现对未记录脑区的动态预测。这种范式特别适用于处理神经像素记录技术中固有的脑区覆盖不完整问题，使得在单个实验无法同时记录所有目标脑区的情况下，仍能进行全脑尺度的交互分析。

衍生相关工作

NeuroPaint数据集的推出催生了多个重要的衍生研究方向。其核心架构启发了后续对跨动物神经表征一致性的深入研究，推动了多会话神经网络模型的发展。基于该数据集的方法论创新，研究人员开发了更高效的脑区间交互分析工具，特别是在表征相似性分析和单试次神经动态解码方面取得显著进展。这些衍生工作不仅扩展了原数据集的应用范围，还促进了神经网络理论与实验神经科学的深度融合，为构建真正意义上的全脑计算模型奠定了坚实基础。

数据集最近研究