BrainMVP-16k

github2025-03-31 更新2025-04-07 收录

下载链接：

https://github.com/openmedlab/BrainMVP

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含16,022次扫描中的240万张多参数MRI图像，涉及3,755名患者，用于多模态脑MRI扫描的跨模态表示学习。

This dataset contains 2.4 million multi-parameter MRI images from 16,022 scans, involving 3,755 patients, and is designed for cross-modal representation learning of multimodal brain MRI scans.

创建时间：

2025-03-08

原始信息汇总

BrainMVP 数据集概述

基本信息

数据集名称: BrainMVP
发布机构: openmedlab
相关论文: Multi-modal Vision Pre-training for Medical Image Analysis
数据集地址: Hugging Face 仓库

数据集内容

数据规模: 16,022 次多参数 MRI 扫描，包含超过 2.4 百万张图像，涉及 3,755 名患者
数据类型: 多模态脑部 MRI 图像（mpMRI）
特点: 首个针对大规模缺失模态医学影像设计的预训练框架

预训练数据

下载方式:
- 自行下载
- 通过 Hugging Face 仓库获取

下游任务数据

来源: 全部为开源数据集
获取支持: 如遇下载困难，可联系邮箱 ruishaohao@sjtu.edu.cn 申请访问权限

预训练模型

模型变体:
- Uniformer (推荐)
- Unet

性能表现

下游任务表现:
- 在 10 个开源分割和分类任务中达到最先进性能
- 分割任务 Dice Score 提升 0.28%-14.47%
- 分类任务准确率提升 0.65%-18.07%

使用方法

安装: bash conda create -n brainmvp python=3.9 conda activate brainmvp pip install -r requirements.txt
预训练: bash CUDA_VISIBLE_DEVICES=0,1,2,3 bash do_pretrain.sh
微调示例: bash cd Downstream bash do_train.sh # 训练 bash do_test.sh # 测试

致谢

代码部分修改自 MONAI

引用

如需使用本数据集，请引用： bibtex @article{rui2024brainmvp, title={BrainMVP: Multi-modal Vision Pre-training for Brain Image Analysis using Multi-parametric MRI}, author={Rui, Shaohao and Chen, Lingzhi and Tang, Zhenyu and Wang, Lilong and Liu, Mianxin and Zhang, Shaoting and Wang, Xiaosong}, journal={arXiv preprint arXiv:2410.10604}, year={2024} }

搜集汇总

数据集介绍

构建方式

在医学影像分析领域，多模态数据的整合对提升诊断精度具有重要意义。BrainMVP-16k数据集通过收集16,022次多参数MRI扫描数据（涵盖3,755名患者的240万张影像），采用创新的跨模态预训练框架构建而成。该框架融合了跨模态图像重建、模态感知对比学习和模态模板蒸馏三大代理任务，有效捕捉了不同成像协议间的深层关联特征，为缺失模态场景下的医学影像分析建立了新的基准。

特点

作为首个面向大规模缺失模态医学影像的预训练数据集，BrainMVP-16k的突出优势体现在其多模态协同表征能力上。数据集覆盖T1、T2、FLAIR等多种MRI参数序列，通过自监督学习范式实现了跨模态知识的迁移。特别值得注意的是，该数据集在10项公开分割与分类任务中展现出显著性能提升，其中分割任务的Dice分数提升幅度达0.28%-14.47%，分类任务准确率提高0.65%-18.07%，验证了其卓越的泛化能力。

使用方法

研究人员可通过Hugging Face平台直接获取该数据集的16k预训练影像资源，配套提供Uniformer和Unet两种预训练模型架构。使用流程包含环境配置、模型下载、预训练及微调四个关键环节，其中conda虚拟环境的创建确保依赖隔离，而模块化的shell脚本（do_pretrain.sh/do_train.sh）则简化了训练流程。对于下游任务适配，开发者可参照BraTS-PED数据集的微调示例，通过修改输入路径和超参数快速实现任务迁移。

背景与挑战

背景概述

BrainMVP-16k数据集由上海交通大学等机构的研究团队于2024年推出，旨在解决多模态医学影像分析中的关键问题。该数据集包含16,022次多参数MRI扫描，涵盖3,755名患者的240万张图像，是首个针对大规模缺失模态医学影像设计的预训练框架。研究团队通过跨模态图像重建、模态感知对比学习和模态模板蒸馏三项代理任务，显著提升了脑部影像分析的性能。这项工作发表在CVPR 2025会议上，在10个开源分割和分类任务中实现了最先进的性能表现，为医学影像分析领域提供了重要的基准工具。

当前挑战

BrainMVP-16k数据集面临的主要挑战体现在两个维度：在领域问题层面，多模态医学影像分析长期受限于模态间相关性学习的困难，特别是当某些模态数据缺失时，传统方法难以保持稳健性能；在构建过程层面，研究团队需要处理大规模多中心医学影像数据的异质性问题，包括扫描协议差异、图像分辨率不一致等。此外，确保跨模态表征学习的有效性，同时保持下游任务的可迁移性，也是构建过程中的关键挑战。这些技术难题的解决为该领域后续研究提供了重要参考。

常用场景

经典使用场景

在医学影像分析领域，BrainMVP-16k数据集为多参数MRI扫描的跨模态表征学习提供了重要支持。该数据集通过整合16,022次扫描的2.4百万张脑部MRI图像，为自监督预训练框架提供了丰富的多模态数据基础，特别适用于处理临床环境中常见的模态缺失问题。研究人员可基于该数据集开展跨模态图像重建、模态感知对比学习等核心任务，为后续的细粒度分析奠定基础。

衍生相关工作

基于该数据集的开源框架已衍生出多项创新研究，包括跨模态重建网络架构优化、模态感知对比损失函数设计等方向。其预训练模型被MONAI等主流医学影像平台集成，推动了一系列改进算法的产生。相关技术路线在BraTS等国际竞赛方案中得到广泛应用，为多模态医学影像分析领域建立了新的研究范式。

数据集最近研究