PanSegData2024
收藏github2025-01-03 收录
下载链接:
https://github.com/NUBagciLab/PaNSegNet
下载链接
链接失效反馈官方服务:
资源简介:
经 IRB 批准后,从 5家机构收集了 767 次 MRI 扫描(385 次 T1W 和 382 次 T2W)。这两个序列都包含在内,以提供互补信息:特定胰腺病变(例如腺癌)在 T1 加权图像上更能显示为低信号(较暗)病变。相反,囊性病变由于其高液体含量而在 T2 加权图像上显得更显眼。中心如下:中心#1:纽约大学 (NYU) 医学中心,中心#2:佛罗里达梅奥诊所 (MCF),中心#3:西北大学 (NU),中心#4:阿勒格尼健康网络 (AHN),中心#5:亚利桑那州梅奥诊所 (MCA)。
Approved by the Institutional Review Board (IRB), a total of 767 MRI scans (385 T1-weighted (T1W) and 382 T2-weighted (T2W)) were collected from five institutions. Both sequences were included to provide complementary information: specific pancreatic lesions (e.g., adenocarcinoma) appear as hypointense (darker) lesions more prominently on T1-weighted images. Conversely, cystic lesions are more conspicuous on T2-weighted images due to their high fluid content. The participating institutions are listed as follows: Institution #1: New York University (NYU) Medical Center, Institution #2: Mayo Clinic Florida (MCF), Institution #3: Northwestern University (NU), Institution #4: Allegheny Health Network (AHN), Institution #5: Mayo Clinic Arizona (MCA).
搜集汇总
数据集介绍

构建方式
在胰腺影像分析领域,构建高质量数据集对于推动深度学习模型的发展至关重要。PanSegData2024数据集的构建采用了多中心回顾性研究设计,涵盖了2004年3月至2022年11月期间从五个医疗中心收集的767例MRI扫描(包括T1加权和T2加权图像)以及来自公开来源的1,350例CT扫描。所有数据均经过机构审查委员会批准,确保了伦理合规性。数据预处理遵循了nnUNet框架的标准格式,为后续的模型训练与评估提供了统一的基础。
特点
该数据集在胰腺影像分割研究中具有显著的代表性。其核心特点在于大规模、多模态与多中心来源,涵盖了CT、T1加权MRI和T2加权MRI等多种成像方式,且数据来自不同协议和设备,引入了真实的异质性挑战。数据集附带了由专家标注的胰腺分割标签,并提供了基于PanSegNet模型在交叉模态和交叉中心设置下达到的先进性能指标(如Dice系数和Hausdorff距离),为算法鲁棒性评估提供了可靠基准。
使用方法
研究人员可通过开放科学框架链接获取数据集,并利用提供的预处理脚本将其转换为nnUNet兼容格式。训练与推理过程可依托集成的nnTransUNetTrainerV2训练器,通过标准命令行指令完成模型训练与预测。数据集支持跨中心泛化测试,用户可配置目标中心列表进行批量推理。此外,团队提供了预训练模型权重与直观的图形用户界面软件,便于临床研究者快速部署分割工具,推动胰腺疾病的诊断与随访应用。
背景与挑战
背景概述
胰腺作为人体关键消化与内分泌器官,其精准的影像学分割对于胰腺癌等疾病的早期诊断与治疗规划至关重要。2024年发布的PanSegData2024数据集,由西北大学Bagci实验室等研究团队构建,旨在应对医学影像分析中胰腺分割的挑战。该数据集汇集了2004年至2022年间来自多中心的767例MRI扫描及1350例公开CT数据,是目前文献中规模最大的胰腺MRI分割数据集。其核心研究问题聚焦于跨模态与跨中心的胰腺自动分割,通过深度学习模型PanSegNet的提出,推动了胰腺疾病影像分析领域的标准化与可重复性研究,为后续算法开发提供了重要基准。
当前挑战
在胰腺影像分割领域,主要挑战在于MRI模态下数据稀缺与异质性。现有方法多基于CT影像,而MRI分割因协议多样、对比度差异及解剖结构模糊性,导致模型泛化能力受限。PanSegData2024在构建过程中,需整合多中心、多协议的MRI数据,克服扫描参数不一致、图像质量参差及标注一致性等难题。此外,数据集需确保跨模态(CT与MRI)性能评估的可靠性,这对深度学习模型的架构设计与训练策略提出了更高要求,以实现在异构数据上的精准分割。
常用场景
经典使用场景
在医学影像分析领域,胰腺的精确分割对于疾病诊断与治疗规划至关重要。PanSegData2024数据集作为目前规模最大的多中心胰腺MRI数据集,其经典使用场景在于为深度学习模型提供跨模态、跨中心的训练与验证基准。研究者可利用该数据集中的T1加权和T2加权MRI序列,结合公开的CT扫描数据,开发并优化如PanSegNet等先进的胰腺分割算法,以应对影像异质性带来的挑战,实现高精度的胰腺组织识别与体积量化。
衍生相关工作
基于PanSegData2024数据集,研究者已衍生出多项经典工作,其中最具代表性的是结合nnUNet与Transformer架构的PanSegNet模型,该模型引入了线性注意力模块以优化体积计算。数据集还催生了与SAM、MedSAM等通用分割模型的对比研究,推动了领域内方法学的交叉验证。这些工作不仅巩固了nnUNet在医学分割中的基准地位,也为多模态胰腺影像分析开辟了新的研究方向,吸引了后续研究关注于跨中心泛化与临床部署优化。
数据集最近研究
最新研究方向
在胰腺影像分析领域,PanSegData2024数据集的发布标志着多模态医学图像分割研究迈入新阶段。该数据集整合了大规模多中心CT与MRI影像,为胰腺疾病的精准诊断提供了关键数据支撑。当前前沿研究聚焦于跨模态与跨中心的泛化性深度学习模型构建,如结合nnUNet与Transformer架构的PanSegNet,其线性注意力模块显著提升了胰腺体积分割的准确性与鲁棒性。相关热点事件包括基于该数据集对SAM及MedSAM等通用分割模型的适应性评估,推动了领域专用算法的优化。这一进展不仅缓解了MRI胰腺分割数据匮乏的困境,也为临床自动化诊断工具的研发奠定了坚实基石,对提升胰腺癌等疾病的早期检测与疗效评估具有深远意义。
以上内容由遇见数据集搜集并总结生成



