five

BrainMVP-16k

收藏
github2025-03-31 更新2025-04-07 收录
下载链接:
https://github.com/openmedlab/BrainMVP
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含16,022次扫描中的240万张多参数MRI图像,涉及3,755名患者,用于多模态脑MRI扫描的跨模态表示学习。

This dataset contains 2.4 million multi-parameter MRI images from 16,022 scans, involving 3,755 patients, and is designed for cross-modal representation learning of multimodal brain MRI scans.
创建时间:
2025-03-08
原始信息汇总

BrainMVP 数据集概述

基本信息

数据集内容

  • 数据规模: 16,022 次多参数 MRI 扫描,包含超过 2.4 百万张图像,涉及 3,755 名患者
  • 数据类型: 多模态脑部 MRI 图像(mpMRI)
  • 特点: 首个针对大规模缺失模态医学影像设计的预训练框架

预训练数据

下游任务数据

  • 来源: 全部为开源数据集
  • 获取支持: 如遇下载困难,可联系邮箱 ruishaohao@sjtu.edu.cn 申请访问权限

预训练模型

性能表现

  • 下游任务表现:
    • 在 10 个开源分割和分类任务中达到最先进性能
    • 分割任务 Dice Score 提升 0.28%-14.47%
    • 分类任务准确率提升 0.65%-18.07%

使用方法

  • 安装: bash conda create -n brainmvp python=3.9 conda activate brainmvp pip install -r requirements.txt

  • 预训练: bash CUDA_VISIBLE_DEVICES=0,1,2,3 bash do_pretrain.sh

  • 微调示例: bash cd Downstream bash do_train.sh # 训练 bash do_test.sh # 测试

致谢

  • 代码部分修改自 MONAI

引用

如需使用本数据集,请引用: bibtex @article{rui2024brainmvp, title={BrainMVP: Multi-modal Vision Pre-training for Brain Image Analysis using Multi-parametric MRI}, author={Rui, Shaohao and Chen, Lingzhi and Tang, Zhenyu and Wang, Lilong and Liu, Mianxin and Zhang, Shaoting and Wang, Xiaosong}, journal={arXiv preprint arXiv:2410.10604}, year={2024} }

搜集汇总
数据集介绍
main_image_url
构建方式
在医学影像分析领域,多模态数据的整合对提升诊断精度具有重要意义。BrainMVP-16k数据集通过收集16,022次多参数MRI扫描数据(涵盖3,755名患者的240万张影像),采用创新的跨模态预训练框架构建而成。该框架融合了跨模态图像重建、模态感知对比学习和模态模板蒸馏三大代理任务,有效捕捉了不同成像协议间的深层关联特征,为缺失模态场景下的医学影像分析建立了新的基准。
特点
作为首个面向大规模缺失模态医学影像的预训练数据集,BrainMVP-16k的突出优势体现在其多模态协同表征能力上。数据集覆盖T1、T2、FLAIR等多种MRI参数序列,通过自监督学习范式实现了跨模态知识的迁移。特别值得注意的是,该数据集在10项公开分割与分类任务中展现出显著性能提升,其中分割任务的Dice分数提升幅度达0.28%-14.47%,分类任务准确率提高0.65%-18.07%,验证了其卓越的泛化能力。
使用方法
研究人员可通过Hugging Face平台直接获取该数据集的16k预训练影像资源,配套提供Uniformer和Unet两种预训练模型架构。使用流程包含环境配置、模型下载、预训练及微调四个关键环节,其中conda虚拟环境的创建确保依赖隔离,而模块化的shell脚本(do_pretrain.sh/do_train.sh)则简化了训练流程。对于下游任务适配,开发者可参照BraTS-PED数据集的微调示例,通过修改输入路径和超参数快速实现任务迁移。
背景与挑战
背景概述
BrainMVP-16k数据集由上海交通大学等机构的研究团队于2024年推出,旨在解决多模态医学影像分析中的关键问题。该数据集包含16,022次多参数MRI扫描,涵盖3,755名患者的240万张图像,是首个针对大规模缺失模态医学影像设计的预训练框架。研究团队通过跨模态图像重建、模态感知对比学习和模态模板蒸馏三项代理任务,显著提升了脑部影像分析的性能。这项工作发表在CVPR 2025会议上,在10个开源分割和分类任务中实现了最先进的性能表现,为医学影像分析领域提供了重要的基准工具。
当前挑战
BrainMVP-16k数据集面临的主要挑战体现在两个维度:在领域问题层面,多模态医学影像分析长期受限于模态间相关性学习的困难,特别是当某些模态数据缺失时,传统方法难以保持稳健性能;在构建过程层面,研究团队需要处理大规模多中心医学影像数据的异质性问题,包括扫描协议差异、图像分辨率不一致等。此外,确保跨模态表征学习的有效性,同时保持下游任务的可迁移性,也是构建过程中的关键挑战。这些技术难题的解决为该领域后续研究提供了重要参考。
常用场景
经典使用场景
在医学影像分析领域,BrainMVP-16k数据集为多参数MRI扫描的跨模态表征学习提供了重要支持。该数据集通过整合16,022次扫描的2.4百万张脑部MRI图像,为自监督预训练框架提供了丰富的多模态数据基础,特别适用于处理临床环境中常见的模态缺失问题。研究人员可基于该数据集开展跨模态图像重建、模态感知对比学习等核心任务,为后续的细粒度分析奠定基础。
衍生相关工作
基于该数据集的开源框架已衍生出多项创新研究,包括跨模态重建网络架构优化、模态感知对比损失函数设计等方向。其预训练模型被MONAI等主流医学影像平台集成,推动了一系列改进算法的产生。相关技术路线在BraTS等国际竞赛方案中得到广泛应用,为多模态医学影像分析领域建立了新的研究范式。
数据集最近研究
最新研究方向
在医学影像分析领域,多模态数据的融合与表征学习正成为研究热点。BrainMVP-16k作为首个针对大规模缺失模态医学影像设计的预训练框架,通过跨模态图像重建、模态感知对比学习和模态模板蒸馏三项代理任务,有效捕捉多参数MRI扫描中的跨模态关联。该数据集包含16,022次扫描的240万张脑部MRI图像,为自监督学习提供了丰富资源。当前研究聚焦于如何将预训练模型迁移至下游分割与分类任务,在BraTS等公开基准测试中展现出14.47%的Dice分数提升和18.07%的分类准确率增长,显著推进了跨模态医学影像分析的边界。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作