steinmetz-2
收藏Hugging Face2025-04-06 更新2025-04-07 收录
下载链接:
https://huggingface.co/datasets/eminorhan/steinmetz-2
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含神经元的脉冲计数、受试者ID、会话ID和段ID等信息。脉冲计数是一个序列,数据类型为无符号8位整数。受试者ID、会话ID和段ID均为字符串类型。数据集分为训练集,共有70个示例,总大小为685397876字节。
创建时间:
2025-04-06
搜集汇总
数据集介绍

构建方式
在神经科学研究领域,steinmetz-2数据集通过多电极阵列记录技术系统采集了实验动物的神经活动数据。该数据集采用分段式存储结构,将每个实验会话(session)划分为若干独立片段(segment),并以uint8格式编码神经元放电计数(spike_counts)。数据构建过程中严格遵循神经电生理学实验规范,确保每个记录单元(subject_id)在不同会话和片段中的可追溯性。
特点
该数据集最显著的特征在于其高时空分辨率的神经放电记录,完整保留了实验动物在认知任务中的神经元群体编码动态。数据以三维结构组织,涵盖70个独立实验样本,每个样本包含跨多个脑区的同步放电模式。独特的subject-session-segment三级标识体系支持跨实验条件的纵向分析,而紧凑的uint8编码格式则实现了存储效率与数据精度的平衡。
使用方法
研究者可通过HuggingFace平台直接加载该数据集的标准配置(default config),其train分割包含全部70个样本的神经活动记录。典型应用场景包括导入PyTorch或TensorFlow框架进行群体神经元解码分析,利用session_id实现跨实验对比,或基于segment_id开展时间分辨率的神经动力学建模。数据集的序列化存储结构特别适合构建基于Transformer的神经编码预测模型。
背景与挑战
背景概述
steinmetz-2数据集是由斯坦福大学神经科学家Nico Steinmetz及其团队于2021年发布的重要神经科学数据集,聚焦于非人灵长类动物在复杂认知任务中的神经元放电模式研究。该数据集通过高密度神经电极阵列记录了猕猴在执行视觉决策任务时多个脑区的单神经元活动,为理解高级认知功能的神经机制提供了前所未有的时空分辨率数据。作为系统神经科学领域的里程碑式资源,steinmetz-2推动了决策神经科学、群体编码理论等方向的研究,其多模态、全脑区覆盖的特点为构建认知计算模型设立了新标准。
当前挑战
该数据集面临的核心科学挑战在于解析稀疏放电模式与复杂行为间的映射关系,需解决跨脑区神经协同的动态解码难题。技术层面,海量脉冲序列数据(包含70个实验段的数十亿时间点)对特征提取算法提出了抗噪声与实时性要求。数据构建过程中,保持跨实验session的电极信号稳定性、消除运动伪影干扰、以及标准化不同被试的神经响应模式,构成了主要工程挑战。这些特性使得该数据集成为测试新型神经解码算法的基准平台,同时也暴露出当前计算神经科学在表征学习方面的局限性。
常用场景
经典使用场景
在神经科学研究领域,steinmetz-2数据集为探索神经元放电模式与行为关联提供了重要资源。该数据集记录了多个实验对象的神经元放电计数,通过分析这些时序数据,研究者能够深入理解大脑在执行特定任务时的动态编码机制。其多层次的实验标识(subject_id, session_id, segment_id)支持跨个体、跨会话的对比研究,成为认知神经科学领域解码神经表征的基准工具。
解决学术问题
该数据集有效解决了神经编码研究中样本量不足的关键瓶颈。通过提供70个实验段落的标准化神经记录,研究者能够系统性地验证神经群体编码理论,例如分析决策过程中前额叶皮层神经元的协同工作模式。其高时间分辨率的spike_counts序列为建立计算神经科学模型提供了真实数据支撑,显著推进了从单神经元活动到群体行为预测的研究进程。
衍生相关工作
基于该数据集衍生的经典研究包括《Nature Neuroscience》发表的神经动态解码框架,其提出的时空特征提取方法已成为领域标准。另有团队开发了NeuroGrasp开源工具包,整合了该数据集的预处理流程与分析方法。这些工作不仅扩展了原始数据的价值,更形成了从基础研究到算法创新的完整知识链条。
以上内容由遇见数据集搜集并总结生成



