MICrONS

Hugging Face2026-02-13 更新2026-02-14 收录

下载链接：

https://huggingface.co/datasets/NeuroBLab/MICrONS

下载链接

链接失效反馈

官方服务：

资源简介：

MICrONS功能活动数据集是一个经过精心策划的多模态数据集，包含来自小鼠视觉皮层的功能性钙成像数据，用于研究小鼠对不同视觉刺激（自然片段（Clip）和参数化视频（Monet2, Trippy））的神经反应。数据集包含14个注册的神经活动会话，涵盖了数千个神经元在多个视觉区域（V1, AL, LM, RL）的钙信号轨迹，以及同步的行为数据（如跑步机速度和瞳孔半径）和眼动追踪数据（瞳孔中心坐标）。数据以高效的HDF5格式存储，便于快速跨会话分析。该数据集适用于特征提取和时间序列预测等任务，特别适用于神经科学和生物学研究。

创建时间：

2026-01-30

原始信息汇总

MICrONS Functional Activity Dataset (14 Sessions) 数据集概述

数据集基本信息

许可证：CC BY 4.0
任务类别：特征提取、时间序列预测
语言：英语
标签：神经科学、钙成像、生物学、多模态
数据集名称：MICrONS Functional Activity Dataset (14 Sessions)
数据规模：1K < n < 10K

数据集内容与来源

该数据集是MICrONS（细胞响应顺序的多尺度网络分析）数据集的一个精选部分。它包含来自小鼠视觉皮层的功能性钙成像数据，这些数据是对各种视觉刺激（自然片段（Clip）和参数化视频（Monet2, Trippy））的响应。视频已进行下采样以匹配神经活动扫描频率，帧的选择对应于扫描时间前至少66毫秒出现的帧。数据以高效、索引化的HDF5格式组织，支持基于刺激身份或大脑解剖结构的快速跨会话分析。

数据构成

会话：14个已注册的神经活动会话。
刺激：三类视频（Clip, Monet2, Trippy），由唯一的条件哈希值标识。
神经数据：来自多个视觉区域（V1, AL, LM, RL）的数千个神经元的钙信号轨迹（响应）。
行为数据：同步的跑步机速度和瞳孔半径。
眼动追踪：用于注视分析的瞳孔中心坐标（x, y）。

数据结构（HDF5文件组织）

root/ ├── BRAIN_AREAS/ # 解剖学索引 │ └── <area_name>/ # 例如：V1, AL, LM, RL │ └── <session_id> -> /sessions/<session_id> ├── SESSIONS/ # 主要数据存储 │ └── <session_id>/ # 例如：4_7, 5_6 │ ├── META/ # 会话范围的元数据 │ │ ├── AREA_INDICES/ # 预计算的神经元掩码 │ │ │ └── <area_name> [Dataset: (N_area_neurons,)] │ │ ├── brain_areas [Dataset: (N_total_neurons,)] │ │ ├── coordinates [Dataset: (N_total_neurons, 3)] │ │ ├── unit_ids [Dataset: (N_total_neurons,)] │ │ ├── condition_hashes [Dataset: (N_trials,)] │ │ └── (Attr) fps [Float: 采样率] │ └── TRIALS/ # 独立试验文件夹 │ └── <trial_idx>/ # 按时间顺序的试验索引 │ ├── responses [Dataset: (N_neurons, F_trial)] │ ├── behavior [Dataset: (2, F_trial)] │ ├── pupil_center [Dataset: (2, F_trial)] │ └── (Attr) condition_hash [String: 视频引用] ├── TYPES/ # 刺激类别索引 │ └── <stim_type>/ # 例如：Clip, Monet2, Trippy │ └── <encoded_hash> -> /videos/<encoded_hash> └── VIDEOS/ # 刺激库（仅保存一次） └── <encoded_hash>/ # condition_hash的编码版本 ├── clip [Dataset: (Frames, H, W)] ├── INSTANCES/ # 指向试验的反向索引 │ └── <session_id>_tr<trial_idx> -> /sessions/<session_id>/trials/<trial_idx> └── (Attr) original_hash [String: 原始哈希值] └── (Attr) type [String: 刺激类型]

访问与使用方法

1. 克隆仓库

数据集存储为大型HDF5文件（.h5），需要安装Git LFS。 bash git lfs install git clone https://huggingface.co/datasets/NeuroBLab/MICrONS cd microns-functional pip install -r requirements.txt

2. 通过Python编程访问

使用huggingface_hub库直接下载阅读器和数据文件。 python

安装依赖：huggingface_hub, h5py, numpy

下载文件并初始化MicronsReader类

数据阅读器（MicronsReader）API 核心功能

初始化：通过上下文管理器使用，确保正确关闭HDF5文件句柄。
查看结构：使用print_structure方法查看文件内部组织，无需将数据加载到内存。
探索数据：支持按会话、刺激类型或大脑区域查询数据库。
- get_video_types()：获取可用刺激类型列表（如[Clip, Monet2, Trippy]）。
- get_hashes_by_type()：获取特定类型的所有唯一哈希值。
- get_hashes_by_session()：查找特定会话中显示的视频。
- get_available_brain_areas()：检查会话中记录的大脑区域（如[V1, AL, LM, RL]）。
加载完整数据：get_full_data_by_hash方法可聚合视频像素以及所有14个会话中记录的神经/行为重复数据，并可选择按大脑区域（如V1）筛选神经元。

内部HDF5结构设计原则

数据库结构旨在通过将视频“Clip”存储一次并链接到跨会话的多个“Trials”来最小化冗余。

/videos/：包含原始视频数组及其到会话实例的链接。
/sessions/：神经活动的“真实来源”，按会话ID和试验索引组织。
/types/：用于按类别（Clip, Monet2等）快速查找视频的索引组。
/brain_areas/：将大脑区域（V1, LM...）链接到记录它们的会话的索引组。

引用要求

如果在研究中使用此数据集或阅读器，请引用原始的MICrONS Phase 3版本和此仓库。

搜集汇总

数据集介绍

构建方式

在神经科学领域，对视觉皮层功能活动的精细解析依赖于高质量的多模态数据。MICrONS数据集的构建过程体现了严谨的实验设计与数据处理流程，其核心数据来源于小鼠视觉皮层的功能性钙成像记录。研究团队通过呈现三类视觉刺激（自然片段Clip、参数化视频Monet2与Trippy）来诱发神经活动，并同步采集了数千个神经元的钙信号轨迹、行为数据（如跑步机速度与瞳孔半径）以及眼动追踪信息。为确保时间对齐的精确性，视频帧率经过下采样以匹配神经扫描频率，且帧选择策略保证了刺激呈现与神经响应间存在至少66毫秒的延迟。最终，所有数据被整合并存储于高效的、支持索引的HDF5格式文件中，这种结构不仅减少了数据冗余，还通过软链接实现了跨会话的快速关联查询。

特点

该数据集在神经计算与系统神经科学研究中展现出多方面的显著特点。其覆盖了14个独立的实验会话，每个会话均包含在多个视觉脑区（如V1、AL、LM、RL）中记录的神经元活动，提供了跨脑区比较的宝贵机会。数据集采用了多模态同步记录，将神经钙信号、行为指标（跑步速度、瞳孔大小）以及瞳孔中心坐标无缝整合，为研究感觉-运动整合与注意机制提供了丰富维度。在数据组织上，其创新的分层索引结构（按脑区、会话、刺激类型和视频哈希）支持灵活的查询方式，研究者可根据刺激身份或解剖位置快速提取目标数据。此外，视频刺激仅存储一次并通过链接关联至所有相关试验，极大优化了存储效率并确保了数据一致性。

使用方法

为便于研究者高效利用这一资源，数据集提供了两种主要的访问方式。用户可选择克隆整个Git LFS管理的代码库以获取完整的HDF5数据文件及配套的读取工具，随后通过Python环境安装依赖并运行。另一种更为轻量的方法是利用`huggingface_hub`库进行编程式访问，直接下载数据文件与读取脚本，并动态导入专用的`MicronsReader`类。该读取器封装了HDF5文件的复杂层次结构，用户可通过上下文管理器安全地打开数据文件，并利用其API探索数据集结构、按刺激类型、会话ID或脑区进行查询。核心功能`get_full_data_by_hash`方法能够聚合指定视频刺激对应的所有神经响应与行为数据重复试验，支持按脑区筛选神经元，从而直接为计算建模或统计分析提供格式规整的多维数据阵列。

背景与挑战

背景概述

MICrONS数据集作为神经科学领域的重要资源，聚焦于多尺度网络分析，旨在解析小鼠视觉皮层在复杂视觉刺激下的功能性活动。该数据集由NeuroBLab等研究机构于近年构建，核心研究问题在于揭示神经元群体编码视觉信息的动态机制，以及跨脑区协同工作的计算原理。通过整合钙成像、行为追踪与眼动数据，MICrONS为理解神经环路的功能架构提供了高分辨率时空观测窗口，显著推动了系统神经科学与计算建模的交叉进展。

当前挑战

该数据集致力于解决视觉神经编码领域的核心挑战，即如何从大规模神经元活动中解码复杂自然刺激的表征，并揭示跨脑区信息整合的动力学规律。构建过程中面临多重技术难题，包括海量钙成像数据的高效采集与同步校准、多模态行为信号的精确对齐，以及跨会话神经活动注册的稳定性保障。此外，数据存储与索引结构的设计需平衡访问效率与冗余控制，以支持灵活的大规模分析需求。

常用场景

经典使用场景

在计算神经科学领域，MICrONS数据集为研究视觉信息处理机制提供了关键实验平台。其经典使用场景集中于分析小鼠视觉皮层神经元群体在自然视频和参数化视觉刺激下的钙离子活动动态。研究者通过整合多脑区（如V1、AL、LM、RL）的神经响应数据与同步行为记录，能够深入探究视觉刺激如何编码于大规模神经回路中，从而揭示感觉信息处理的群体编码原理。

衍生相关工作

围绕MICrONS数据集，已衍生出一系列经典研究工作。这些工作主要集中于发展新型神经编码模型，如基于卷积神经网络或循环网络的刺激响应预测框架。同时，该数据集促进了跨模态对齐方法的研究，用于整合神经活动、行为与刺激信息。此外，许多研究利用其多脑区记录探索了层次化视觉信息处理网络，为构建大规模脑功能仿真模型提供了关键数据支撑。

数据集最近研究