MMCMR-427K
收藏github2025-12-29 更新2025-12-31 收录
下载链接:
https://github.com/wangziblake/CardioMM_MMCMR-427K
下载链接
链接失效反馈官方服务:
资源简介:
MMCMR-427K是迄今为止最大、最全面的多模态CMR k-space数据库,包含427,465个多线圈k-space数据,配有条理化的元数据(约3.5 TB),来自1,504名参与者的6,120次扫描,涵盖13个国际中心(四个公共存储库和九个临床中心)、15台扫描仪(四个供应商,从低场到超高场强度)、12种CMR模态和三个人群(亚洲、欧洲和北美)的17种CVD类别。
MMCMR-427K is the largest and most comprehensive multimodal CMR k-space database to date, comprising 427,465 multi-coil k-space datasets accompanied by structured metadata totaling approximately 3.5 TB. These data are derived from 6,120 scans of 1,504 participants, covering 13 international centers (4 public repositories and 9 clinical centers), 15 scanners from 4 vendors with field strengths ranging from low-field to ultra-high-field, 12 CMR modalities, and 17 CVD categories across three population groups: Asian, European, and North American.
创建时间:
2025-12-01
原始信息汇总
MMCMR-427K 数据集概述
数据集基本信息
- 数据集名称:MMCMR-427K
- 核心目标:为超快心血管磁共振(CMR)成像构建一个通用的重建基础模型提供支持。
- 数据规模:包含 427,465 个多线圈 k 空间数据,总数据量约 3.5 TB。
- 数据来源:来自 13 个国际中心(4 个公共存储库和 9 个临床中心)。
数据构成与多样性
- 参与者:1,504 名参与者,共 6,120 次扫描。
- 扫描设备:涵盖 15 台扫描仪,来自 4 个供应商,磁场强度从低场到超高场。
- 成像模态:包含 12 种 CMR 模态。
- 疾病类别:覆盖 17 种心血管疾病(CVD)类别。
- 人群分布:涵盖亚洲、欧洲和北美三个人群。
- 数据格式:多线圈 k 空间数据,并配有结构化元数据。
关联模型:CardioMM
- 模型性质:首个能够动态适应异构超快 CMR 成像场景的通用重建基础模型。
- 技术特点:统一了语义上下文理解与基于物理的数据一致性。
- 验证性能:
- 在内部中心达到最先进的性能。
- 在未见过的外部环境中表现出强大的零样本泛化能力。
- 在高度加速重建(8×–24×)下,可靠地保留了 11 个关键心脏表型、3 个定量心肌生物标志物以及诊断图像质量。
数据获取与状态
- 当前状态:数据库仍在构建中,计划在圣诞节假期后发布。
- 临床数据:收集的临床 CMR 数据集将在未来公开。
- 已用公共数据集:包括 https://github.com/CmrxRecon, https://ocmr.info, 以及 https://www.ukbiobank.ac.uk。其中,英国生物银行的数据需经申请批准后获取。
相关资源与使用
- 代码框架:提供了 CardioMM 框架的训练、测试、可视化和自动化分析代码。
- 环境要求:Python 3.8, PyTorch 2.0.1, PyTorch Lightning 1.9.0。
- 使用限制:仅限学术用途,不可用于商业目的。
- 引用文献:主要引用预印本论文(arXiv:2512.21652),并列出多篇高度相关论文。
补充说明
- 互补性:该框架填补了多模态 CMR 计算流程中关键的上游空白,为下游分割、表型分析、诊断等任务提供了更稳健的基础。
- 社区参与:在组织的 CMRxRecon 挑战系列(2023–2025)中,已有来自 125 个国家和地区的超过 11,000 名活跃参与者参与。
搜集汇总
数据集介绍

构建方式
在心血管磁共振成像领域,数据采集的多样性与复杂性构成了技术发展的核心挑战。MMCMR-427K数据库的构建过程体现了对多源异构数据的系统性整合,其汇集了来自13个国际中心的6120次扫描数据,覆盖1504名参与者,涵盖了15种不同厂商的扫描设备、12种成像模态以及17类心血管疾病。该数据库通过精心策划,将多线圈k空间数据与结构化元数据配对,形成了约3.5TB的大规模资源,旨在为超快速成像重建提供坚实的数据基础。
特点
该数据集以其前所未有的规模与多样性著称,作为目前最大且最全面的多模态心血管磁共振k空间数据库,它跨越了亚洲、欧洲和北美人群,融合了从低场强到超高场强的扫描设备。其核心特点在于能够支持跨场景的泛化学习,为开发通用型重建基础模型提供了关键支撑。数据集中蕴含的丰富临床与环境异质性,使得基于其训练的模型能够展现出强大的零样本泛化能力,从而适应真实世界医疗环境的复杂需求。
使用方法
为促进心血管成像研究的可重复性与技术进步,该数据集配套提供了完整的模型训练与评估代码框架。使用者需首先配置指定的Python与PyTorch环境,随后通过提供的脚本依次完成训练子集重组、测试子集欠采样、模型训练、图像重建以及自动化表型分析等流程。对于希望使用自有数据进行测试的研究者,需确保数据格式与所提供格式一致。所有代码与数据均限于学术用途,旨在推动超快速心血管成像重建技术的临床转化与应用。
背景与挑战
背景概述
心血管磁共振成像作为无创评估心血管疾病的关键技术,其多模态成像能够提供全面的病理生理信息,但扫描时间漫长且临床环境异质性限制了广泛应用。MMCMR-427K数据集由帝国理工学院与复旦大学等机构的研究团队于2025年构建,旨在通过构建大规模多模态k空间数据库,支撑通用重建基础模型的开发,以解决超快速心血管成像中的跨场景适应性问题。该数据集整合了来自13个国际中心、15种扫描仪及12种成像模态的427,465例数据,覆盖三大洲人群的17类心血管疾病,为推进精准医疗与人工智能在医学影像中的融合奠定了数据基石。
当前挑战
在心血管影像领域,实现超快速且鲁棒的重建面临双重挑战:一是异质临床环境中扫描协议、设备型号及患者表现的多样性导致传统模型泛化能力不足;二是高加速因子下k空间数据的欠采样会引发重建伪影,危及关键心脏表型与生物标志物的保真度。数据构建过程中,需克服多中心数据标准化、隐私保护与伦理合规、以及海量多模态k空间数据(约3.5TB)的存储与协同处理等工程难题,同时确保跨厂商扫描仪与不同场强设备的数据一致性。
常用场景
经典使用场景
在心血管磁共振成像领域,MMCMR-427K数据集为超快速成像重建研究提供了关键支撑。其经典应用场景在于训练和验证通用型重建基础模型,如CardioMM,该模型能够动态适应不同扫描仪、协议和患者表现的异质性环境。通过整合大规模多中心、多模态的k空间数据,研究者可利用该数据集探索高度加速(如8倍至24倍)下的图像重建质量,确保关键心脏表型和生物标志物的可靠保留,从而推动快速CMR成像技术的临床转化。
衍生相关工作
基于MMCMR-427K数据集,已衍生出一系列重要的学术与实践活动。其中最突出的是CMRxRecon挑战系列(2023-2025),吸引了全球125个国家和地区超过11,000名参与者,共同推进加速心脏MRI的机器学习研究。相关成果发表在《Radiology: Artificial Intelligence》、《IEEE Transactions on Medical Imaging》及《Scientific Data》等权威期刊,这些工作不仅验证了数据集的效用,也进一步拓展了多模态、跨中心心血管影像重建的算法边界与评估标准。
数据集最近研究
最新研究方向
在心血管磁共振成像领域,多模态成像技术虽能提供全面的疾病诊断信息,但其临床应用常受限于扫描时间过长和设备环境异质性。MMCMR-427K数据集的推出,标志着该领域正聚焦于构建通用型重建基础模型,以应对异构临床环境下的超快速成像需求。基于此数据集开发的CardioMM模型,通过融合语义上下文理解与物理约束的数据一致性,实现了在多样化扫描仪、协议及患者表现中的稳健重建,展现出卓越的零样本泛化能力。这一进展不仅揭示了心血管成像中未被充分挖掘的加速潜力,更为下游分割、表型分析和诊断任务奠定了可靠基础,推动了下一代临床工作流程的革新。
以上内容由遇见数据集搜集并总结生成



