MMCMR-427K

github2025-12-29 更新2025-12-31 收录

下载链接：

https://github.com/wangziblake/CardioMM_MMCMR-427K

下载链接

链接失效反馈

官方服务：

资源简介：

MMCMR-427K是迄今为止最大、最全面的多模态CMR k-space数据库，包含427,465个多线圈k-space数据，配有条理化的元数据（约3.5 TB），来自1,504名参与者的6,120次扫描，涵盖13个国际中心（四个公共存储库和九个临床中心）、15台扫描仪（四个供应商，从低场到超高场强度）、12种CMR模态和三个人群（亚洲、欧洲和北美）的17种CVD类别。

MMCMR-427K is the largest and most comprehensive multimodal CMR k-space database to date, comprising 427,465 multi-coil k-space datasets accompanied by structured metadata totaling approximately 3.5 TB. These data are derived from 6,120 scans of 1,504 participants, covering 13 international centers (4 public repositories and 9 clinical centers), 15 scanners from 4 vendors with field strengths ranging from low-field to ultra-high-field, 12 CMR modalities, and 17 CVD categories across three population groups: Asian, European, and North American.

创建时间：

2025-12-01

原始信息汇总

MMCMR-427K 数据集概述

数据集基本信息

数据集名称：MMCMR-427K
核心目标：为超快心血管磁共振（CMR）成像构建一个通用的重建基础模型提供支持。
数据规模：包含 427,465 个多线圈 k 空间数据，总数据量约 3.5 TB。
数据来源：来自 13 个国际中心（4 个公共存储库和 9 个临床中心）。

数据构成与多样性

参与者：1,504 名参与者，共 6,120 次扫描。
扫描设备：涵盖 15 台扫描仪，来自 4 个供应商，磁场强度从低场到超高场。
成像模态：包含 12 种 CMR 模态。
疾病类别：覆盖 17 种心血管疾病（CVD）类别。
人群分布：涵盖亚洲、欧洲和北美三个人群。
数据格式：多线圈 k 空间数据，并配有结构化元数据。

关联模型：CardioMM

模型性质：首个能够动态适应异构超快 CMR 成像场景的通用重建基础模型。
技术特点：统一了语义上下文理解与基于物理的数据一致性。
验证性能：
- 在内部中心达到最先进的性能。
- 在未见过的外部环境中表现出强大的零样本泛化能力。
- 在高度加速重建（8×–24×）下，可靠地保留了 11 个关键心脏表型、3 个定量心肌生物标志物以及诊断图像质量。

数据获取与状态

当前状态：数据库仍在构建中，计划在圣诞节假期后发布。
临床数据：收集的临床 CMR 数据集将在未来公开。
已用公共数据集：包括 https://github.com/CmrxRecon, https://ocmr.info, 以及 https://www.ukbiobank.ac.uk。其中，英国生物银行的数据需经申请批准后获取。

补充说明

互补性：该框架填补了多模态 CMR 计算流程中关键的上游空白，为下游分割、表型分析、诊断等任务提供了更稳健的基础。
社区参与：在组织的 CMRxRecon 挑战系列（2023–2025）中，已有来自 125 个国家和地区的超过 11,000 名活跃参与者参与。

搜集汇总

数据集介绍

构建方式

在心血管磁共振成像领域，数据采集的多样性与复杂性构成了技术发展的核心挑战。MMCMR-427K数据库的构建过程体现了对多源异构数据的系统性整合，其汇集了来自13个国际中心的6120次扫描数据，覆盖1504名参与者，涵盖了15种不同厂商的扫描设备、12种成像模态以及17类心血管疾病。该数据库通过精心策划，将多线圈k空间数据与结构化元数据配对，形成了约3.5TB的大规模资源，旨在为超快速成像重建提供坚实的数据基础。

特点

该数据集以其前所未有的规模与多样性著称，作为目前最大且最全面的多模态心血管磁共振k空间数据库，它跨越了亚洲、欧洲和北美人群，融合了从低场强到超高场强的扫描设备。其核心特点在于能够支持跨场景的泛化学习，为开发通用型重建基础模型提供了关键支撑。数据集中蕴含的丰富临床与环境异质性，使得基于其训练的模型能够展现出强大的零样本泛化能力，从而适应真实世界医疗环境的复杂需求。

使用方法

为促进心血管成像研究的可重复性与技术进步，该数据集配套提供了完整的模型训练与评估代码框架。使用者需首先配置指定的Python与PyTorch环境，随后通过提供的脚本依次完成训练子集重组、测试子集欠采样、模型训练、图像重建以及自动化表型分析等流程。对于希望使用自有数据进行测试的研究者，需确保数据格式与所提供格式一致。所有代码与数据均限于学术用途，旨在推动超快速心血管成像重建技术的临床转化与应用。

背景与挑战

背景概述

心血管磁共振成像作为无创评估心血管疾病的关键技术，其多模态成像能够提供全面的病理生理信息，但扫描时间漫长且临床环境异质性限制了广泛应用。MMCMR-427K数据集由帝国理工学院与复旦大学等机构的研究团队于2025年构建，旨在通过构建大规模多模态k空间数据库，支撑通用重建基础模型的开发，以解决超快速心血管成像中的跨场景适应性问题。该数据集整合了来自13个国际中心、15种扫描仪及12种成像模态的427,465例数据，覆盖三大洲人群的17类心血管疾病，为推进精准医疗与人工智能在医学影像中的融合奠定了数据基石。

当前挑战

在心血管影像领域，实现超快速且鲁棒的重建面临双重挑战：一是异质临床环境中扫描协议、设备型号及患者表现的多样性导致传统模型泛化能力不足；二是高加速因子下k空间数据的欠采样会引发重建伪影，危及关键心脏表型与生物标志物的保真度。数据构建过程中，需克服多中心数据标准化、隐私保护与伦理合规、以及海量多模态k空间数据（约3.5TB）的存储与协同处理等工程难题，同时确保跨厂商扫描仪与不同场强设备的数据一致性。

常用场景

经典使用场景

在心血管磁共振成像领域，MMCMR-427K数据集为超快速成像重建研究提供了关键支撑。其经典应用场景在于训练和验证通用型重建基础模型，如CardioMM，该模型能够动态适应不同扫描仪、协议和患者表现的异质性环境。通过整合大规模多中心、多模态的k空间数据，研究者可利用该数据集探索高度加速（如8倍至24倍）下的图像重建质量，确保关键心脏表型和生物标志物的可靠保留，从而推动快速CMR成像技术的临床转化。

衍生相关工作

基于MMCMR-427K数据集，已衍生出一系列重要的学术与实践活动。其中最突出的是CMRxRecon挑战系列（2023-2025），吸引了全球125个国家和地区超过11,000名参与者，共同推进加速心脏MRI的机器学习研究。相关成果发表在《Radiology: Artificial Intelligence》、《IEEE Transactions on Medical Imaging》及《Scientific Data》等权威期刊，这些工作不仅验证了数据集的效用，也进一步拓展了多模态、跨中心心血管影像重建的算法边界与评估标准。

数据集最近研究