MICrONS
收藏MICrONS Functional Activity Dataset (14 Sessions) 数据集概述
数据集基本信息
- 许可证:CC BY 4.0
- 任务类别:特征提取、时间序列预测
- 语言:英语
- 标签:神经科学、钙成像、生物学、多模态
- 数据集名称:MICrONS Functional Activity Dataset (14 Sessions)
- 数据规模:1K < n < 10K
数据集内容与来源
该数据集是MICrONS(细胞响应顺序的多尺度网络分析)数据集的一个精选部分。它包含来自小鼠视觉皮层的功能性钙成像数据,这些数据是对各种视觉刺激(自然片段(Clip)和参数化视频(Monet2, Trippy))的响应。视频已进行下采样以匹配神经活动扫描频率,帧的选择对应于扫描时间前至少66毫秒出现的帧。数据以高效、索引化的HDF5格式组织,支持基于刺激身份或大脑解剖结构的快速跨会话分析。
数据构成
- 会话:14个已注册的神经活动会话。
- 刺激:三类视频(Clip, Monet2, Trippy),由唯一的条件哈希值标识。
- 神经数据:来自多个视觉区域(V1, AL, LM, RL)的数千个神经元的钙信号轨迹(响应)。
- 行为数据:同步的跑步机速度和瞳孔半径。
- 眼动追踪:用于注视分析的瞳孔中心坐标(x, y)。
数据结构(HDF5文件组织)
root/ ├── BRAIN_AREAS/ # 解剖学索引 │ └── <area_name>/ # 例如:V1, AL, LM, RL │ └── <session_id> -> /sessions/<session_id> ├── SESSIONS/ # 主要数据存储 │ └── <session_id>/ # 例如:4_7, 5_6 │ ├── META/ # 会话范围的元数据 │ │ ├── AREA_INDICES/ # 预计算的神经元掩码 │ │ │ └── <area_name> [Dataset: (N_area_neurons,)] │ │ ├── brain_areas [Dataset: (N_total_neurons,)] │ │ ├── coordinates [Dataset: (N_total_neurons, 3)] │ │ ├── unit_ids [Dataset: (N_total_neurons,)] │ │ ├── condition_hashes [Dataset: (N_trials,)] │ │ └── (Attr) fps [Float: 采样率] │ └── TRIALS/ # 独立试验文件夹 │ └── <trial_idx>/ # 按时间顺序的试验索引 │ ├── responses [Dataset: (N_neurons, F_trial)] │ ├── behavior [Dataset: (2, F_trial)] │ ├── pupil_center [Dataset: (2, F_trial)] │ └── (Attr) condition_hash [String: 视频引用] ├── TYPES/ # 刺激类别索引 │ └── <stim_type>/ # 例如:Clip, Monet2, Trippy │ └── <encoded_hash> -> /videos/<encoded_hash> └── VIDEOS/ # 刺激库(仅保存一次) └── <encoded_hash>/ # condition_hash的编码版本 ├── clip [Dataset: (Frames, H, W)] ├── INSTANCES/ # 指向试验的反向索引 │ └── <session_id>_tr<trial_idx> -> /sessions/<session_id>/trials/<trial_idx> └── (Attr) original_hash [String: 原始哈希值] └── (Attr) type [String: 刺激类型]
访问与使用方法
1. 克隆仓库
数据集存储为大型HDF5文件(.h5),需要安装Git LFS。 bash git lfs install git clone https://huggingface.co/datasets/NeuroBLab/MICrONS cd microns-functional pip install -r requirements.txt
2. 通过Python编程访问
使用huggingface_hub库直接下载阅读器和数据文件。
python
安装依赖:huggingface_hub, h5py, numpy
下载文件并初始化MicronsReader类
数据阅读器(MicronsReader)API 核心功能
- 初始化:通过上下文管理器使用,确保正确关闭HDF5文件句柄。
- 查看结构:使用
print_structure方法查看文件内部组织,无需将数据加载到内存。 - 探索数据:支持按会话、刺激类型或大脑区域查询数据库。
get_video_types():获取可用刺激类型列表(如[Clip, Monet2, Trippy])。get_hashes_by_type():获取特定类型的所有唯一哈希值。get_hashes_by_session():查找特定会话中显示的视频。get_available_brain_areas():检查会话中记录的大脑区域(如[V1, AL, LM, RL])。
- 加载完整数据:
get_full_data_by_hash方法可聚合视频像素以及所有14个会话中记录的神经/行为重复数据,并可选择按大脑区域(如V1)筛选神经元。
内部HDF5结构设计原则
数据库结构旨在通过将视频“Clip”存储一次并链接到跨会话的多个“Trials”来最小化冗余。
/videos/:包含原始视频数组及其到会话实例的链接。/sessions/:神经活动的“真实来源”,按会话ID和试验索引组织。/types/:用于按类别(Clip, Monet2等)快速查找视频的索引组。/brain_areas/:将大脑区域(V1, LM...)链接到记录它们的会话的索引组。
引用要求
如果在研究中使用此数据集或阅读器,请引用原始的MICrONS Phase 3版本和此仓库。




