Human Connectome Project (HCP)
收藏arXiv2025-10-16 更新2025-10-17 收录
下载链接:
https://www.humanconnectome.org/
下载链接
链接失效反馈资源简介:
HCP数据集收集了来自1096名受试者的21633次fMRI运行数据,包括任务、静息状态和电影观看条件下的数据,总扫描时间为2291小时。数据集经过预处理,包括将fMRI数据映射到标准皮质表面网格,并将其重新采样到224x560的平坦网格上。数据集被分为训练、验证和测试集,以便于模型训练和评估。
The HCP dataset comprises 21,633 fMRI runs from 1,096 participants, including data collected under task, resting-state, and movie-watching conditions, with a total scanning time of 2,291 hours. The dataset has undergone preprocessing, including mapping the fMRI data to a standard cortical surface mesh and resampling it onto a 224×560 flat mesh. It is split into training, validation, and test sets to facilitate model training and evaluation.
提供机构:
Sophont Medical AI Research Center (MedARC)
创建时间:
2025-10-16
原始信息汇总
人类连接组项目数据集概述
数据集总览
人类连接组协调设施(CCF)管理和分发一系列专注于人类大脑连接研究的公共研究数据,目前支持20个人类连接组研究项目。
主要研究项目分类
健康成人连接组
HCP Young Adult
- 主要研究者:Kamil Ugurbil, David Van Essen
- 样本规模:1200名受试者,年龄22-35岁
- 技术方法:3T MR, 7T MR, MEG
- 参与机构:华盛顿大学圣路易斯分校、明尼苏达大学、牛津大学等
- 最新数据发布:2025年8月11日 HCP-Young Adult 2025
生命周期连接组数据
包含4个项目,活动时间2013-2020年,获取和共享跨生命周期的多模态成像数据,覆盖四个年龄组(产前、0-5岁、6-21岁、36-100+岁)
HCP Aging
- 主要研究者:Beau Ances等
- 样本规模:1200名受试者,年龄36-100+岁
- 技术方法:3T MRI
- 最新数据发布:2021年2月26日 HCP-Aging Lifespan 2.0 Release
HCP Development
- 主要研究者:Deanna Barch等
- 样本规模:1350名受试者,年龄5-21岁
- 技术方法:3T MRI
- 最新数据发布:2021年2月26日 HCP-Development Lifespan 2.0 Release
Lifespan Baby Connectome Project
- 主要研究者:Jed Elison, Weili Lin
- 样本规模:500名受试者,年龄0-5岁
- 技术方法:3T MR
Lifespan Developing Human Connectome Project
- 主要研究者:David Edwards等
- 样本规模:1500名受试者,年龄20-44周孕后
- 技术方法:MR
疾病相关连接组
包含18个项目,活动时间2017-2027年,应用HCP风格的数据收集方法研究有脑部疾病风险或患有脑部疾病的受试者队列
代表性项目包括:
- Alzheimers Disease Connectome Project:300名受试者,年龄55-90岁
- BANDA: Connectomes Related to Anxiety & Depression:225名受试者,年龄14-17岁
- Epilepsy Connectome Project:340名受试者,年龄18-50岁
- Human Connectome Project for Early Psychosis:400名受试者,年龄16-35岁
- Dimensional Connectomics of Anxious Misery:250名受试者,年龄18-45岁
软件工具
Connectome Workbench v2.1.0
- 开源可视化发现工具,用于映射神经影像数据
Connectome MR Pipeline v4.7.0
- 处理HCP MRI图像的工具集
HCP MEG Pipelines v3.0
- 使用FieldTrip分析MEG数据的工具
数据访问
所有数据通过ConnectomeDB平台提供,数据属于公共领域,不包含受保护的健康信息。
搜集汇总
数据集介绍

构建方式
在神经影像学领域,Human Connectome Project (HCP) 数据集的构建采用了先进的表面映射预处理流程。原始4D体积fMRI数据通过标准结构MRI重建皮质表面网格,并配准至fsLR等群组模板表面。利用pycortex工具将表面映射数据投影至扁平化皮质网格,通过线性插值重采样为224×560像素的规则二维图像网格,最终生成包含7.77万有效像素的扁平图序列,完整保留了皮质信号的拓扑结构。
特点
该数据集的核心特征在于其时空维度的丰富性,包含来自1096名受试者的21633次fMRI扫描,总时长达2291小时,涵盖任务态、静息态和观影态等多种认知状态。数据经过零均值单位方差归一化处理,并以1秒重复时间进行时序重采样,形成820万帧扁平图序列。其独特优势在于通过二维扁平图表征既保留了全脑皮质信号完整性,又通过局部邻域归纳偏置提升了模型训练效率,为fMRI基础模型研究提供了高保真结构化数据基础。
使用方法
该数据集适用于视觉Transformer架构的预训练与下游任务评估。在预训练阶段,采用时空掩码自编码器框架,将16帧单通道扁平图序列划分为16×16×16时空块,以90%掩码率进行自监督学习。下游任务评估时,通过冻结编码器与可训练的注意力探针分类器结合,在认知状态解码、性别分类和CLIP视觉解码等基准任务中验证表征质量。数据集按受试者划分为训练、验证和测试集,确保家族关联受试者处于同一划分,保障评估结果的可靠性。
背景与挑战
背景概述
人类连接组计划(Human Connectome Project, HCP)于2010年代初期由华盛顿大学、明尼苏达大学和牛津大学等机构联合发起,旨在通过高分辨率神经影像技术绘制人脑结构和功能连接图谱。该数据集汇集了逾千名受试者的多模态脑成像数据,包括静息态、任务态和自然刺激条件下的功能磁共振成像记录,核心科学问题聚焦于解析人脑网络架构与认知行为之间的关联。HCP通过标准化预处理流程和开放数据政策,显著推动了计算神经科学、脑疾病生物标志物发现及人工智能在神经影像领域的交叉研究,成为脑连接组学研究的基石资源。
当前挑战
在脑功能解码领域,HCP需应对高维度、低信噪比的4D fMRI数据建模挑战,具体表现为时空动态特征的稀疏性与个体间变异性的耦合问题。数据构建过程中,面临原始体积数据到表面映射的几何转换复杂性,需平衡全脑信号保真度与计算效率;同时,跨被试、跨模态数据的标准化整合要求克服扫描参数差异和生理伪影干扰,而皮层平坦化映射虽能保留局部功能拓扑,却需解决网格重采样中的信息损失与背景噪声抑制问题。
常用场景
经典使用场景
在认知神经科学研究中,Human Connectome Project数据集被广泛应用于构建人脑功能连接图谱。研究者通过分析该数据集中的静息态和任务态功能磁共振成像数据,能够揭示不同脑区之间的功能协同模式。这种经典应用为理解大脑网络组织架构提供了重要窗口,特别是在探索认知状态与神经活动关联机制方面展现出独特价值。
解决学术问题
该数据集有效解决了神经科学领域多个关键学术问题,包括大脑功能分区界定、个体差异神经基础探索以及脑网络发育轨迹刻画等。通过提供高质量的多模态脑影像数据,HCP使研究者能够系统研究脑结构与功能的关系,推动了对神经精神疾病病理机制的深入理解,为建立脑功能计算模型奠定了数据基础。
衍生相关工作
HCP数据集催生了众多经典衍生研究,包括Brainnetome Atlas脑分区图谱、HCP-MMP1.0多模态脑分区框架等基础性工作。在计算方法层面,基于该数据集开发的SWIFT、BrainLM等深度学习模型开创了脑影像分析新范式。这些衍生工作共同推动了脑连接组学向标准化、定量化方向发展。
以上内容由遇见数据集搜集并总结生成



