five

Angelou0516/TotalSegmentatorMR

收藏
Hugging Face2026-05-01 更新2026-05-03 收录
下载链接:
https://hf-mirror.com/datasets/Angelou0516/TotalSegmentatorMR
下载链接
链接失效反馈
官方服务:
资源简介:
TotalSegmentator MRI v2.0.0数据集是一个公开的医学影像数据集,包含616个异质性MRI扫描(T1、T2、PD、DIXON-style等序列,多种场强、扫描仪、切片厚度、对比剂),并带有50个解剖结构的体素级注释,覆盖全身。数据集分为561个训练样本和55个内部测试样本。数据集的注释流程包括初始分割、手动分割、模型预测和手动修正,所有注释均由经验丰富的放射科医生审核。数据集的结构包括每个扫描的MRI图像和对应的50个二进制掩码文件。数据集的总大小约为5.8 GB,采用CC BY-NC-SA 2.0许可证(非商业用途)。

The TotalSegmentator MRI v2.0.0 dataset is a public release of 616 heterogeneous MRI scans (T1, T2, PD, DIXON-style and other sequences, multiple field strengths, scanners, slice thicknesses, contrast agents) with voxel-wise annotations of 50 anatomical structures spanning the whole body. The dataset is divided into 561 training samples and 55 internal test samples. The annotation pipeline includes initial segmentations, manual segmentation, model predictions, and manual refinements, with all annotations reviewed by a board-certified radiologist. The dataset structure includes MRI images and corresponding 50 binary mask files for each scan. The total size of the dataset is approximately 5.8 GB, licensed under CC BY-NC-SA 2.0 (non-commercial).
提供机构:
Angelou0516
搜集汇总
数据集介绍
main_image_url
构建方式
TotalSegmentatorMR数据集的构建依托于来自巴塞尔大学医院PACS系统及影像数据共享平台的616例异质性MRI扫描数据,涵盖T1、T2、PD、DIXON等多种序列及场强与层厚参数。标注流程采用迭代策略:首先利用公开的CT/MR模型生成初始分割,随后对首批10例患者进行人工标注以训练内部nnU-Net模型;模型预测结果经人工修正后,每新增125例患者即重新训练模型。所有标注最终均由一名具有12年经验的委员会认证放射科医师在盲法下逐例审校修正,确保每个扫描仅保留一份经过验证的金标准掩膜。
特点
该数据集核心特点在于序列无关性与全身多器官覆盖,共包含50个解剖结构的体素级标注,涵盖肾上腺、主动脉、骨骼肌等关键组织区域。数据来源的采集时间跨度长达12年(2011–2023),并融合了不同厂商、扫描仪模型及对比剂使用条件,显著提升了模型在实际临床场景中的泛化能力。此外,皮下脂肪、躯干脂肪等结构被移至独立子任务模型,集中于主干模型的高效训练,整体规模约5.8 GB,采用CC BY-NC-SA 2.0非商业许可协议发布。
使用方法
数据集以标准化目录结构组织,每个受试者文件夹下包含MRI图像(mri.nii.gz)和50个独立的二元分割掩膜(segmentations/*.nii.gz),掩膜与图像自动对齐。配套的meta.csv文件以分号分隔提供图像标识、训练/测试划分、年龄、性别、设备参数及来源信息,便于用户按需筛选子集。用户可直接加载nii.gz文件进行模型训练或评估,推荐结合nnU-Net框架使用,并引用原始Radiology论文以遵循学术规范。
背景与挑战
背景概述
TotalSegmentatorMRI数据集由Jakob Wasserthal及其团队于2025年发布,主要依托于瑞士巴塞尔大学医院与Radiology期刊的合作成果。该数据集聚焦于磁共振成像(MRI)中多器官与全身结构的序列无关分割任务,涵盖616例异质性MRI扫描(包括T1、T2、PD、DIXON等多种序列),并由资深放射科医师手工标注了50个解剖结构。作为TotalSegmentator系列在MRI领域的延伸,它填补了CT领域成熟分割工具向MRI转移的空白,解决了MRI图像因序列差异、场强变化和扫描参数多样而导致的标注困难,为开发鲁棒的全身多器官分割模型提供了标准化基准。数据集已公开于Zenodo,并被广泛引用于医学影像分析研究中,显著推动了MRI自动化分析在临床中的实际应用。
当前挑战
该数据集面临的核心挑战包括:其一,MRI图像固有的序列多样性(如T1、T2、PD及压脂序列)导致灰度分布、对比度和伪影模式高度异质,传统分割算法难以泛化,亟需序列无关的鲁棒模型。其二,构建过程中,初始公共模型对MRI数据表现不佳,团队需手动标注首批10例患者以引导迭代训练,并在每125例后重新训练模型,结合人工修正与放射科医师审核,此过程耗时且耗费人力,对标注一致性和质量控制提出严苛要求。此外,数据集规模(616例)相较于CT版本的巨大数量稍显不足,部分罕见病变或解剖变异可能未被充分覆盖,影响模型在极端场景下的可靠性。
常用场景
经典使用场景
在医学影像分析领域,TotalSegmentatorMR数据集凭借其多样化的MRI序列类型(涵盖T1、T2、PD、DIXON等)和全身体积覆盖,成为多器官分割任务的研究基石。该数据集为研究人员提供了一个统一的基准平台,用于开发和评估序列无关的全身解剖结构分割算法,支持从颅面部至下肢的50个解剖结构同时分割。其经典使用场景集中在对nnU-Net等深度学习架构的训练与验证上,利用精心标注的高质量掩膜和完整的元数据,推动端到端分割模型的产生,进而提升了跨序列、跨场强、跨机构泛化能力。
实际应用
在实际临床应用环境中,TotalSegmentatorMR数据集赋能了自动化全身疾病评估系统的构建。基于该数据集训练的模型可辅助放射科医师完成肿瘤负荷量化、脂肪组织分布测量、骨骼肌质量评估等多器官定量分析,减少人工勾画时间并提升重复性。例如,在结直肠癌肝转移随访中,自动分割肝脏、脾脏、主动脉等结构的能力能够为体表面积及容积计算提供基础;在代谢性疾病研究中,皮下脂肪与内脏脂肪的分离则解锁了肥胖相关的风险评估。此外,其序列无关的特性确保了模型在不同MRI采集协议下的稳健部署,真正降低了跨中心部署障碍。
衍生相关工作
TotalSegmentatorMR数据集衍生出一系列标志性工作,其中最核心的是提出原始的TotalSegmentator MRI分割模型,该模型基于nnU-Net框架训练并在Radiology上发布了验证结果,证明了其在跨序列全身多器官分割任务中超越以往局部模型的效果。此外,研究者利用该数据集开展了序列不变表示学习的研究,开发了可适应T1、T2、PD等不同对比度的统一分割框架;同时,该数据集也被用于迁移学习实验,为CT与MRI联合多模态分割任务提供了跨模态适配的初始权重。在工具链方面,衍生出的TotalSegmentator开源工具箱完美集成该数据集,极大便利了科研社区的复现与拓展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作