openBHB
收藏Hugging Face2025-05-14 更新2025-05-15 收录
下载链接:
https://huggingface.co/datasets/benoit-dufumier/openBHB
下载链接
链接失效反馈官方服务:
资源简介:
Open Big Healthy Brains (OpenBHB) 数据集是一个包含超过5000份来自全球93个不同中心的健康对照组的3D脑部MRI图像的大型数据集。这些图像经过了CAT12、FreeSurfer和Quasi-Raw三种预处理方式,并经过了视觉质量检查。数据集分为训练集、验证集和测试集,每个样本包含6个预处理的numpy数组。此外,该数据集还提供了用于脑年龄预测和场效应去除的挑战赛。
创建时间:
2025-05-14
搜集汇总
数据集介绍

构建方式
在神经影像学研究领域,openBHB数据集通过整合10个公开脑MRI数据库(如IXI、ABIDE等)构建而成,覆盖全球93个中心的健康受试者,年龄跨度为6至88岁。所有T1加权图像均经过CAT12、FreeSurfer和Quasi-Raw标准化预处理流程,并实施严格视觉质控,最终形成包含体素形态测量和表面形态测量特征的多维度数据矩阵。
特点
该数据集的核心价值在于其大规模多中心设计,囊括超过5000例均衡性别分布的样本,同时提供原始影像与六类衍生特征数组。独特之处在于完整记录采集站点、磁场强度等元数据,为研究场效应偏差提供理想实验基础,其预分割的训练-验证-测试集架构进一步保障了算法评估的严谨性。
使用方法
研究者可通过加载标准化NumPy数组直接获取预处理特征,利用附带的参与者元数据表进行协变量控制。数据集专为脑年龄预测与场效应消除挑战设计,支持在RAMP平台提交表征学习算法,通过线性探针评估生物学信号保留与混杂变量剔除的性能表现。
背景与挑战
背景概述
脑影像数据科学领域长期面临多中心数据异构性对模型泛化能力的制约,OpenBHB数据集于2022年由法国CEA NeuroSpin实验室主导发布,整合了全球93个中心的10个公共脑MRI数据集。该数据集聚焦健康人群的脑年龄预测与站点效应消除两大核心问题,通过统一CAT12、FreeSurfer等三种预处理流程,提供了涵盖体素形态测量与表面形态测量的多维特征,为脑发育与衰老研究建立了标准化基准。
当前挑战
在脑年龄预测任务中,模型需克服不同扫描站点磁场强度、设备参数引入的分布偏移问题,同时保持对生物学年龄特征的敏感度。数据构建阶段面临多中心数据融合的技术瓶颈,包括原始数据格式差异、空间配准一致性、质量控制标准化等挑战,需通过严格的视觉质检与多图谱特征提取确保数据可比性。
常用场景
经典使用场景
在神经影像学领域,OpenBHB数据集为大脑年龄预测研究提供了标准化基准。该数据集整合了来自全球93个中心的5000余例健康受试者的三维脑MRI数据,通过统一的CAT12、FreeSurfer和Quasi-Raw预处理流程,生成了体素形态测量学和表面形态测量学特征。研究者可利用这些多模态特征构建机器学习模型,精准分析大脑结构与年龄变化的关联规律,为认知衰老研究提供量化依据。
实际应用
在临床实践中,OpenBHB支撑的脑年龄预测模型可作为神经退行性疾病的早期筛查工具。通过对比个体实际年龄与模型预测的脑年龄差异,能够识别出加速衰老的异常模式。该数据集涵盖6至88岁的广谱年龄范围,其多站点设计增强了模型在不同扫描设备间的泛化能力,为构建临床适用的生物标志物系统奠定了数据基石。
衍生相关工作
基于OpenBHB的挑战赛已催生系列创新研究,例如开发对抗性表示学习框架以解耦年龄与站点信息。相关成果延伸至阿尔茨海默病早期诊断、自闭症谱系障碍分类等方向,部分工作通过迁移学习将去偏表示应用于其他神经精神疾病数据集。这些衍生研究共同推进了多中心脑影像数据的标准化处理范式,促进了神经影像计算方法的可复现性发展。
以上内容由遇见数据集搜集并总结生成



