five

PanTSMini

收藏
Hugging Face2025-08-06 更新2025-08-07 收录
下载链接:
https://huggingface.co/datasets/BodyMaps/PanTSMini
下载链接
链接失效反馈
官方服务:
资源简介:
PanTS(胰腺肿瘤分割数据集)是由约翰霍普金斯大学创建的大型多机构数据集,包含来自145个医疗中心的36,390个三维CT体积数据。该数据集提供了超过993,000个解剖结构的专家验证的体素级标注,包括胰腺肿瘤、胰腺头部、体部和尾部,以及24个周围的解剖结构,如血管/骨骼结构和腹部/胸部器官。作为同类中最大和最全面的数据集,PanTS为开发胰腺CT分析AI模型提供了一个新的基准。

PanTS (Pancreatic Tumor Segmentation Dataset) is a large multi-institutional dataset created by Johns Hopkins University, containing 36,390 3D CT volumetric data from 145 medical centers. This dataset provides expert-validated voxel-level annotations for over 993,000 anatomical structures, including pancreatic tumors, the head, body, and tail of the pancreas, as well as 24 surrounding anatomical structures such as vascular/bony structures and abdominal/thoracic organs. As the largest and most comprehensive dataset of its kind, PanTS serves as a new benchmark for developing AI models for pancreatic CT analysis.
创建时间:
2025-07-23
原始信息汇总

数据集概述

基本信息

  • 名称: PanTS (The Pancreatic Tumor Segmentation Dataset)
  • 许可证: CC-BY-NC-SA-4.0
  • 任务类别: 图像分割
  • 标签: 医学
  • 规模: 1K<n<10K

数据集内容

  • 数据量: 包含36,390个三维CT扫描数据,来自145个医学中心。
  • 标注: 专家验证的体素级标注,涵盖超过993,000个解剖结构。
  • 标注范围:
    • 胰腺肿瘤
    • 胰腺头部、体部和尾部
    • 24个周围解剖结构(如血管/骨骼结构和腹部/胸部器官)

数据集划分

  • 训练集: PanTS-tr (n=9,000)
  • 测试集: PanTS-te (n=901)

学术信息

  • 论文标题: PanTS: The Pancreatic Tumor Segmentation Dataset
  • 作者: Wenxuan Li, Xinze Zhou, Qi Chen, Tianyu Lin, Pedro R.A.S. Bassi, ..., Alan Yuille, Zongwei Zhou
  • 机构: 约翰霍普金斯大学
  • 论文链接: https://www.cs.jhu.edu/~zongwei/publication/li2025pants.pdf
  • 项目页面: https://www.zongweiz.com/dataset

下载说明

  • 下载命令: shell git clone https://github.com/MrGiovanni/PanTS.git cd PanTS bash download_PanTS_data.sh # 需要约300GB存储空间 bash download_PanTS_label.sh

  • 标注文件请求: 需通过邮件联系Zongwei Zhou (zzhou82@jh.edu)获取PanTSMini_Label.tar.gz文件。

引用

bibtex @article{li2025pants, title={PanTS: The Pancreatic Tumor Segmentation Dataset}, author={Li, Wenxuan and Zhou, Xinze and Chen, Qi and Lin, Tianyu and Bassi, Pedro RAS and Plotka, Szymon and Cwikla, Jaroslaw B and Chen, Xiaoxi and Ye, Chen and Zhu, Zheren and others}, journal={arXiv preprint arXiv:2507.01291}, year={2025}, url={https://github.com/MrGiovanni/PanTS} }

致谢

  • 支持机构:
    • Lustgarten Foundation for Pancreatic Cancer Research
    • Patrick J. McGovern Foundation Award
    • National Institutes of Health (NIH) under Award Number R01EB037669
  • 技术支持: 约翰霍普金斯大学IT@JH团队和DISCOVERY HPC资源。
搜集汇总
数据集介绍
main_image_url
构建方式
在医学影像分析领域,胰腺肿瘤分割一直面临着数据稀缺的挑战。PanTSMini数据集作为PanTS的精简版本,其构建过程体现了严谨的科研范式。研究团队从145家医疗机构收集了36,390例三维CT影像,通过专家团队对993,000多个解剖结构进行体素级标注,涵盖胰腺肿瘤及其周围24个重要解剖结构。数据集采用9,000例作为训练集(PanTS-tr),901例作为测试集(PanTS-te),确保了数据的代表性和统计效力。
使用方法
研究人员可通过GitHub仓库获取该数据集,需执行指定的shell脚本完成下载。由于数据规模较大(约300GB存储空间),建议在具备高性能计算环境的平台上使用。标注文件需通过邮件申请获取,体现了数据使用的规范性。该数据集特别适合用于开发胰腺肿瘤自动分割算法,研究者可利用训练集进行模型训练,并在标准测试集上评估性能。数据的三维特性要求使用专门的医学影像处理工具进行解析和分析。
背景与挑战
背景概述
PanTS数据集由约翰霍普金斯大学的研究团队于2025年创建,旨在为胰腺肿瘤分割研究提供大规模、多机构的标准化数据资源。该数据集收录了来自145家医疗中心的36,390例三维CT影像,包含超过99.3万个经过专家验证的体素级标注,覆盖胰腺肿瘤、胰头、胰体、胰尾以及24种周边解剖结构。作为该领域迄今最全面的基准数据集,PanTS不仅推动了胰腺CT分析的算法创新,更为多器官联合分割、小肿瘤检测等关键临床问题提供了重要研究平台。数据集获得Lustgarten胰腺癌研究基金会等多家权威机构支持,其技术路线已申请多项专利保护。
当前挑战
胰腺肿瘤分割面临三大核心挑战:解剖结构的高度可变性导致传统算法泛化能力受限,小尺寸肿瘤(平均直径<2cm)的微弱对比度造成精确边界划分困难,多器官紧密毗邻易引发预测结果相互渗透。数据构建过程中,研究团队需克服多中心影像参数差异带来的标准化难题,通过开发自适应重采样算法统一空间分辨率;针对标注一致性,采用三重专家复核机制解决复杂病例中器官边界模糊的判定问题;计算层面则需处理单例CT超2GB的高维数据,为此专门设计了分布式标注系统以提升处理效率。
常用场景
经典使用场景
在医学影像分析领域,PanTSMini数据集作为胰腺肿瘤分割任务的重要基准,为研究者提供了大规模、多中心的三维CT扫描数据。该数据集通过精确的体素级标注,支持深度学习模型在胰腺及其周围结构的自动分割任务中进行训练与验证,成为算法开发与性能评估的黄金标准。
解决学术问题
PanTSMini数据集有效解决了胰腺肿瘤影像分析中数据稀缺与标注不一致的学术难题。通过整合来自145家医疗机构的标准化数据,该数据集为探索肿瘤形态异质性、解剖结构空间关系等基础研究提供了可靠平台,显著提升了算法在复杂解剖环境下的泛化能力,推动了精准医学影像分析的理论突破。
实际应用
临床实践中,该数据集支撑的AI模型已应用于胰腺癌早期筛查、手术规划导航等关键场景。通过高精度分割肿瘤与邻近血管结构,辅助医生评估肿瘤可切除性,降低术中风险。部分衍生技术已整合进智能诊断系统,实现了从影像获取到定量分析的端到端解决方案。
数据集最近研究
最新研究方向
在医学影像分析领域,PanTS数据集作为目前规模最大、标注最全面的胰腺肿瘤分割数据集,为胰腺癌的早期诊断和治疗规划提供了重要支持。近年来,基于该数据集的研究主要集中在多模态深度学习模型的开发,通过结合三维CT影像与临床数据,提升胰腺肿瘤分割的精确度和鲁棒性。与此同时,迁移学习和联邦学习技术的引入,使得跨医疗机构的模型训练成为可能,有效解决了数据隐私和分布差异的挑战。该数据集的发布不仅推动了胰腺癌影像分析的算法创新,也为临床决策系统的智能化发展奠定了坚实基础。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作