five

MOSAICMRI

收藏
arXiv2026-04-14 更新2026-04-15 收录
下载链接:
https://mosaicmri.ai
下载链接
链接失效反馈
官方服务:
资源简介:
MOSAICMRI是由南加州大学和犹他大学联合构建的大规模开源肌肉骨骼MRI数据集,旨在推动基于机器学习的MRI方法研究。该数据集包含2671个全采样多线圈体积(共计80,156张切片),覆盖脊柱、肩部、膝关节等多样解剖结构,并整合了PD、T1、T2等多种成像对比度及4-46个接收线圈的配置差异。数据采集自1.5T西门子扫描仪,经伦理审查后公开,严格排除了非诊断性扫描。其创新性在于突破现有脑部与膝关节数据的局限性,为研究跨解剖结构的模型泛化性、加速重建算法的鲁棒性提供了重要基准,可广泛应用于医学影像重建、分割及病理分析等领域。

MOSAICMRI is a large-scale open-source musculoskeletal MRI dataset jointly constructed by the University of Southern California and the University of Utah, aiming to advance research on machine learning-based MRI methodologies. This dataset contains 2671 fully-sampled multi-coil volumes (totaling 80,156 slices), covering diverse anatomical structures such as the spine, shoulder, and knee, and integrates multiple imaging contrasts including PD, T1, and T2, as well as configuration variations of 4 to 46 receiver coils. The data were acquired using 1.5T Siemens MRI scanners, and the dataset was made publicly available after undergoing ethical review, with non-diagnostic scans strictly excluded. Its innovative feature lies in breaking through the limitations of existing brain and knee MRI datasets, providing a critical benchmark for research on model generalization across anatomical structures and the robustness of accelerated reconstruction algorithms, and can be widely applied in fields such as medical image reconstruction, segmentation, and pathological analysis.
提供机构:
南加州大学·计算机科学系; 南加州大学·电气与计算机工程系; 南加州大学·科学人工智能基础中心; 犹他大学·放射与影像科学系
创建时间:
2026-04-14
搜集汇总
数据集介绍
构建方式
在磁共振成像领域,数据集的构建质量直接决定了深度学习模型的泛化能力与临床适用性。MOSAICMRI数据集的构建遵循了严格的临床数据筛选与标准化流程,其原始数据来源于西门子1.5T磁共振扫描仪在临床实践中采集的约4TB匿名数据。构建过程首先排除了不完整扫描、非诊断性定位像、系统校准序列以及与标准切片重建不兼容的三维容积序列。随后,通过人工视觉检查,进一步剔除了存在严重运动伪影或磁敏感伪影的案例,确保了数据质量。最终筛选出的2671个全采样多线圈容积数据,均以HDF5格式存储,并采用与ISMRMRD兼容的元数据结构,其内部k空间数据布局遵循fastMRI规范,便于现有代码库的复用与迁移。
使用方法
MOSAICMRI数据集为加速MRI重建等机器学习任务提供了标准化的训练与评估基准。数据集已按患者级别划分为训练集、验证集和测试集,比例分别为70%、15%和15%,有效避免了数据泄漏。研究者可利用该数据集训练如E2E-VarNet等端到端重建网络,评估模型在4倍或8倍加速等多倍率下的性能。其使用不仅限于单一解剖结构的模型训练,更支持跨解剖结构的泛化性研究,例如训练于脊柱数据并测试于膝关节。此外,数据集支持对模型容量与数据规模缩放规律的探究,以及通过基于DreamSim嵌入空间的相似性过滤等方法进行高效数据子集筛选,为开发鲁棒且通用的MRI重建模型提供了全面且可靠的实验平台。
背景与挑战
背景概述
磁共振成像作为临床诊断的核心模态,其深度学习应用长期受限于公开数据集的解剖结构单一性。2026年,南加州大学与犹他大学的研究团队联合发布了MOSAICMRI数据集,旨在突破传统脑部与膝关节影像的局限。该数据集收录了2,671个全采样多线圈肌肉骨骼原始k空间数据,涵盖脊柱、肩、髋等十余种解剖部位,并整合了多种成像对比度与采集方向。通过构建当前规模最大的开源肌肉骨骼MRI数据库,研究团队为探索机器学习方法在复杂解剖环境下的泛化能力与鲁棒性提供了关键基础设施,推动了跨解剖结构的可迁移性研究。
当前挑战
该数据集致力于解决肌肉骨骼MRI加速重建中模型泛化能力不足的核心挑战。现有方法在单一解剖结构上表现优异,却难以适应临床实践中多样化的解剖形态、组织对比度与采集协议差异。构建过程中面临多重困难:肌肉骨骼影像本身存在解剖结构碎片化、成像协议异构性强等固有复杂性;数据采集需协调多部位、多对比度的临床扫描,并克服运动伪影与采集中断等技术障碍;数据标注需建立统一的解剖分类与协议标注体系,同时确保患者隐私信息完全匿名化。这些挑战共同塑造了数据集的长尾分布特性与多维异质性。
常用场景
经典使用场景
在磁共振成像领域,深度学习模型常受限于脑部与膝关节等狭窄解剖区域的公开数据集,这制约了模型在多样化临床环境中的泛化能力评估。MOSAICMRI作为当前最大规模的开源原始肌肉骨骼MRI数据集,其经典使用场景聚焦于加速MRI重建任务的系统性基准测试。研究者利用该数据集训练如E2E-VarNet等深度学习模型,在4倍与8倍加速条件下评估重建质量,通过峰值信噪比和结构相似性指数等指标量化模型性能。数据集涵盖脊柱、肩、髋、踝等多元解剖结构,以及T1、T2、质子密度等多种对比度,为模型在复杂肌肉骨骼成像场景中的稳定性提供了标准化验证平台。
解决学术问题
该数据集主要解决了肌肉骨骼MRI领域中深度学习模型泛化性与鲁棒性研究的空白问题。传统研究因数据局限,难以探究模型在不同解剖结构、成像协议及线圈配置下的表现。MOSAICMRI通过提供大规模、多对比度、多解剖区域的原始k空间数据,使学者能够系统分析模型在跨解剖迁移、协议偏移及数据分布变化中的行为。例如,实验表明混合解剖数据训练能显著提升低样本区域的重建性能,揭示了跨解剖相关性可利用的价值;同时,研究识别出足部与肘部等解剖群组间存在良好的泛化特性,为模型适应性理论提供了实证基础。
实际应用
在实际临床应用中,MOSAICMRI为开发鲁棒的MRI加速重建算法提供了关键数据支撑。肌肉骨骼MRI涉及关节退行性病变、创伤及肿瘤等多种疾病的诊断,成像协议因解剖区域异质性而高度复杂。该数据集模拟了真实临床环境中多样的采集条件,包括不同视野、空间分辨率及脂肪抑制策略,使得基于其训练的模型能更稳定地应用于肩、踝、腕等传统数据稀缺部位的快速成像。此外,通过DreamSim嵌入空间的相似性筛选,可从数据集中提取紧凑的子集用于特定部位重建,这为资源受限场景下的模型部署提供了可行性路径。
数据集最近研究
最新研究方向
在医学影像领域,深度学习已广泛应用于磁共振成像(MRI)的加速重建、伪影去除和分割等任务。然而,现有研究多依赖于脑部和膝部等有限解剖部位的公开数据集,这限制了模型在多样化临床场景中的泛化能力评估。MOSAICMRI作为目前最大的开源原始肌肉骨骼(MSK)MRI数据集,其前沿研究聚焦于利用解剖结构多样性探索跨部位泛化机制。近期实验表明,在低样本条件下,混合多解剖部位数据训练的模型显著优于单一部位模型,揭示了可挖掘的跨解剖相关性。研究进一步通过训练-测试解剖部位转移实验,识别出足部与肘部等具有良好相互泛化能力的解剖群组,并强调域转移性能受训练集规模、解剖特性及协议特异性因素共同影响。这一进展为开发更稳健的MRI重建模型提供了关键见解,并推动了肌肉骨骼影像领域向多解剖、多协议评估范式的转变。
相关研究论文
  • 1
    MosaicMRI: A Diverse Dataset and Benchmark for Raw Musculoskeletal MRI南加州大学·计算机科学系; 南加州大学·电气与计算机工程系; 南加州大学·科学人工智能基础中心; 犹他大学·放射与影像科学系 · 2026年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作