大型临床异质性MRI数据集

Name: 大型临床异质性MRI数据集
Creator: 乌得勒支大学医学中心·MRI治疗与诊断计算成像组; 乌得勒支大学医学中心·放射科
Published: 2026-01-09 00:08:58
License: 暂无描述

arXiv2026-01-09 更新2026-01-10 收录

下载链接：

https://github.com/JelmervanL/Quantitative-mapping-from-conventional-MRI

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集由乌得勒支大学医学中心构建，包含4,121次MRI扫描会话，覆盖1,786名11-89岁的临床患者，采集自4种不同的3T Philips扫描系统。数据包含常规T1加权、T2加权和FLAIR序列，采集时间跨度为2018-2023年，涵盖肿瘤学、神经退行性疾病等多种病理类型。数据集通过严格的预处理流程（包括配准、重采样和偏置场校正）确保质量，主要用于训练自监督物理引导的深度学习模型，旨在从常规MRI生成定量T1/T2/PD图谱，解决临床定量MRI可及性不足的难题。

This dataset was constructed by the University Medical Center Utrecht. It comprises 4,121 MRI scanning sessions from 1,786 clinical patients aged 11 to 89 years, acquired using four distinct 3T Philips scanning systems. The data includes conventional T1-weighted, T2-weighted, and FLAIR sequences, with a collection period spanning 2018 to 2023, covering multiple pathological types such as oncology and neurodegenerative diseases. The dataset ensures data quality through rigorous preprocessing workflows including registration, resampling, and bias field correction. It is primarily intended for training self-supervised physics-guided deep learning models, with the goal of generating quantitative T1/T2/PD maps from conventional MRI to address the challenge of insufficient accessibility to clinical quantitative MRI.

提供机构：

乌得勒支大学医学中心·MRI治疗与诊断计算成像组; 乌得勒支大学医学中心·放射科

创建时间：

2026-01-09

原始信息汇总

数据集概述

数据集基本信息

数据集名称: Self-Supervised Physics-Guided Quantitative Mapping from Conventional MRI
核心内容: 一个自监督物理引导的深度学习框架，用于从常规临床MRI（T1加权、T2加权、FLAIR）直接推断定量T1、T2和质子密度（PD）图。
对应论文: "Quantitative Mapping from Conventional MRI Using Self-Supervised Physics-Guided Deep Learning: Applications to a Large-Scale, Clinically Heterogeneous Dataset"

数据集规模与来源

数据规模: 包含4,121个扫描会话。
采集时间跨度: 六年。
扫描设备: 四种不同的3T MRI扫描仪系统。
数据特点: 大规模、临床异质性数据集，捕捉了真实世界的临床变异性。

方法概述

框架类型: 自监督物理引导深度学习框架。
核心原理: 将基于Bloch的信号模型直接集成到训练目标中。
输入: 广泛可用的临床常规T1加权、T2加权和FLAIR MRI。
输出: 定量T1、T2和质子密度（PD）图。

性能评估

测试集: 超过600个测试会话。
组织值一致性: 生成图谱的白质和灰质值与文献范围一致。
不变性: 生成的图谱对扫描仪硬件和采集协议组表现出不变性，组间变异系数≤1.1%。
可重复性: 跨扫描仪系统和序列参数的体素级可重复性优异，T1和T2的Pearson r和一致性相关系数超过0.82。
相对差异: 所有定量参数的平均相对体素级差异较低，尤其是T2（<6%）。

数据与代码结构

代码仓库: 包含论文的实现。
环境管理: 使用uv和Weights & Biases。
主要目录:
- checkpoints/: 保存训练好的模型/权重。
- configs/: 训练和测试的YAML配置文件。
- example_data/: 用于测试流程的示例数据，包含NIfTI图像、组织掩膜和CSV文件。
- qmap/: 主要源代码包，包含数据加载、模型、选项和工具模块。
主要入口文件: train.py（训练）、test.py（推理）。

数据准备要求

数据格式: 预处理的NIfTI文件。
预处理步骤:
1. DICOM转NIfTI。
2. 将T1w和FLAIR配准到T2w空间（刚性配准）。
3. 重采样至1×1 mm²平面内分辨率。
4. N4偏置场校正。
CSV配置文件: 必须为每个受试者的每种对比度提供特定的序列参数（如TR、TE、FA、TI），用于Bloch方程信号建模。需为训练/验证/测试集提供单独的CSV文件。
文件结构示例:

data_root/ ├── images/ # 存放图像文件（如_FLAIR.nii.gz, _T1w.nii.gz, _T2w.nii.gz） ├── masks/ # 存放组织掩膜文件（如_brain.nii.gz, _csf.nii.gz, _gm.nii.gz, _wm.nii.gz） └── *.csv # 数据集定义和序列参数的CSV文件

使用方式

训练: 使用uv run train.py --config configs/your_config.yaml命令在自有数据上训练模型。（注：原始临床训练数据集因隐私法规无法公开。）
推理/测试:
1. 从发布页面下载预训练模型权重。
2. 将权重文件放置在checkpoints/trained_model/qstar_model_PD0p1_TV0p01_lq20目录中。
3. 运行uv run test.py --config configs/test.yaml进行推理。
示例输出: 定量图谱和指标将保存在checkpoints文件夹的指定目录中（例如results/test_T1wT2wFLAIR_example/）。输出包括生成的定量T1、T2和PD图。

许可证

许可证类型: 知识共享署名-非商业性使用许可证（CC BY-NC）。

搜集汇总

数据集介绍

构建方式

在磁共振成像领域，定量映射技术虽能提供组织内在参数，但其依赖专用采集协议，限制了大规模临床应用。本研究构建了一个大型临床异质性MRI数据集，旨在通过自监督物理引导深度学习框架，从常规临床MRI中推断定量T1、T2和质子密度图。数据收集自乌得勒支大学医学中心放射科，时间跨度为2018年至2023年，涵盖了所有神经成像协议。数据集包含4,121次扫描会话，涉及1,786名独特受试者，年龄范围11至89岁，包括肿瘤、神经退行性疾病、癫痫和血管疾病等多种病理状况。扫描在四台不同的飞利浦3T MRI系统上进行，序列类型包括T1加权3D Spoiled GRE、T2加权2D TSE和T2-FLAIR 3D TSE。数据预处理包括格式转换、刚性配准、重采样至1×1 mm²平面分辨率、偏置场校正及低信噪比切片排除，最终按受试者以80/5/15%的比例划分为训练、验证和测试集。

特点

该数据集的核心特征在于其大规模与临床异质性。它整合了六年内多台MRI扫描仪采集的超过4,000次扫描会话，真实反映了临床实践中硬件和采集参数的多样性。序列参数如重复时间、回波时间和翻转角存在显著变化，覆盖了常规神经成像协议的全部范围。数据集中包含了广泛的病理类型和受试者人口统计学信息，确保了其代表性和泛化能力。此外，数据预处理流程统一，确保了跨会话的一致性，同时保留了临床数据的原始变异性。这种异质性为训练鲁棒的深度学习模型提供了理想环境，使模型能够学习不受扫描仪和协议变化影响的定量映射关系，为大规模定量生物标志物研究奠定了基础。

使用方法

该数据集主要用于训练和评估自监督物理引导深度学习框架，以从常规T1加权、T2加权和FLAIR图像生成定量T1、T2和质子密度图。使用方法包括将预处理后的图像输入基于U-Net架构的卷积神经网络，该网络通过注意力融合机制动态加权多对比度输入特征。训练过程采用物理引导的自监督策略，利用Bloch-based信号模型从预测的定量图合成常规加权图像，并通过L1损失、总变分正则化和质子密度软下界约束优化模型。在超过600次测试会话中，生成的定量图表现出与文献范围一致的白质和灰质值，且对扫描仪硬件和协议组具有不变性。此外，该框架支持跨扫描仪和序列参数的受试者内重现性分析，为大规模回顾性研究和临床转化提供了工具。代码和模型权重已公开，便于社区验证和应用扩展。

背景与挑战

背景概述

磁共振成像（MRI）是临床神经影像学的基石，但传统MRI提供的定性信息高度依赖于扫描仪硬件和采集参数。定量MRI（qMRI）虽能直接测量组织内在参数，但其对专用采集协议和重建算法的需求限制了其可用性，阻碍了大规模生物标志物研究的发展。为此，乌得勒支大学医学中心计算成像组的研究团队于2024年构建了大型临床异质性MRI数据集，旨在通过自监督物理引导的深度学习框架，从广泛可用的临床常规MRI中推断定量T1、T2和质子密度图。该数据集涵盖了2018年至2023年间在四种不同3T MRI扫描仪上采集的4,121次扫描会话，捕获了真实世界临床变异性，为推进定量神经影像研究提供了关键资源。

当前挑战

该数据集旨在解决从常规MRI生成定量图的逆问题，其核心挑战在于消除扫描仪硬件和采集协议引入的非生理变异性，以实现跨设备和协议的定量映射可重复性。在构建过程中，数据集面临多重挑战：首先，临床MRI数据的异质性极高，包括不同扫描仪型号、序列参数和患者病理状态的差异，这要求模型具备强大的泛化能力；其次，自监督学习框架需在不依赖配对定量参考数据的情况下，通过物理信号模型约束训练目标，而Bloch方程对快速自旋回波序列的近似不准确性增加了建模复杂度；此外，全局强度归一化与缩放问题、多对比度输入的特征融合机制设计，以及二维与三维采集几何不匹配带来的部分容积效应，均对数据预处理和模型鲁棒性提出了严峻考验。

常用场景

经典使用场景

在神经影像学领域，磁共振成像（MRI）作为临床诊断的核心工具，其定性特征常受硬件和采集参数影响。大型临床异质性MRI数据集通过整合超过4000个扫描会话，覆盖六年间的多种神经疾病病例，为研究提供了真实世界的临床变异性。该数据集最经典的使用场景在于训练自监督物理引导深度学习框架，从常规T1加权、T2加权和FLAIR图像中推断定量T1、T2和质子密度图，从而消除扫描仪和协议差异带来的非生理性变异，实现大规模定量生物标志物研究。

实际应用

在实际临床应用中，该数据集支持将常规MRI档案转化为定量图谱，无需额外扫描时间。这为脑肿瘤、神经退行性疾病和血管病变的诊断与监测提供了定量工具。例如，在胶质瘤和阿尔茨海默病的研究中，生成的T1、T2和质子密度图能够用于疾病表征和治疗反应评估。此外，该框架通过消除扫描仪和协议差异，提升了下游深度学习模型的泛化能力，促进了多中心临床研究的协同合作。

衍生相关工作

该数据集衍生了一系列经典研究工作，主要集中在自监督物理引导深度学习的扩展与优化。例如，Qiu等人开发了协议感知的无监督回顾性T1和T2映射方法，以处理多样化的成像参数。Moya-Sáez等人提出了基于MRI物理先验的合成加权图像生成框架。Borges等人利用无监督学习实现MRI数据的协调与超分辨率。这些工作共同推动了定量神经影像从研究向临床实践的转化，为大规模生物标志物探索奠定了算法基础。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集