five

CYSTSCAN-PKD

收藏
github2026-03-24 更新2026-03-27 收录
下载链接:
https://github.com/Istituto-Mario-Negri-Medical-Imaging/CYSTSCAN-PKD
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多囊肾病(PKD)微CT扫描的自动囊肿分割和计数数据。数据集分为两个部分:1_Segmentation_pipeline和2_Cyst_counting_pipeline。1_Segmentation_pipeline包含KRATS和XRATS扫描的图像和地面实况数据,用于训练和测试分割模型。2_Cyst_counting_pipeline包含用于优化和评估囊肿计数算法的囊肿掩膜和手动计数数据。

This dataset contains automatic cyst segmentation and counting data from micro-CT scans of polycystic kidney disease (PKD). The dataset is divided into two sections: 1_Segmentation_pipeline and 2_Cyst_counting_pipeline. The 1_Segmentation_pipeline includes image and ground truth data of KRATS and XRATS scans, which are used for training and testing segmentation models. The 2_Cyst_counting_pipeline contains cyst masks and manual counting data for optimizing and evaluating cyst counting algorithms.
创建时间:
2026-03-16
原始信息汇总

CYSTSCAN-PKD 数据集概述

数据集基本信息

  • 数据集名称:CYSTSCAN-PKD
  • 核心用途:用于多囊肾病(PKD)动物模型微CT扫描中囊肿的自动分割与计数。
  • 伴随文献CYSTSCAN-PKD: a comprehensive pipeline for automatic cyst segmentation and counting on µCT scans from PKD animal models,发表于《Computers in Biology and Medicine》,2026年,DOI待定。
  • 许可证:Apache 2.0

数据内容与结构

数据集可通过Zenodo获取(需申请访问):https://doi.org/10.5281/zenodo.19049543

数据集包含两个主要部分,存放于data/目录下:

1. 分割流程数据 (1_Segmentation_pipeline/)

  • Dataset1 (KRATS扫描)
    • 训练集:20个NIfTI格式图像文件 (*_0000.nii.gz) 及对应的标注文件(标签1:肾脏,标签2:囊肿)。
    • 测试集:5个NIfTI格式图像文件、标注文件以及预计算的分割掩膜。
  • Dataset2 (XRATS扫描)
    • 图像:5个NIfTI格式文件。
    • 标注:5个NIfTI格式标注文件。
    • 推理结果:预计算的分割掩膜。

2. 囊肿计数流程数据 (2_Cyst_counting_pipeline/)

  • 优化集:包含10个囊肿掩膜NIfTI文件(标签1:肾脏,标签2:囊肿)以及操作员1的手动计数Excel文件 (O1_count.xlsx)。
  • 评估集:包含10个囊肿掩膜NIfTI文件以及操作员1和操作员2的手动计数Excel文件 (O1_O2_counts.xlsx)。

算法与工具

  • 核心算法:基于距离变换峰值检测进行囊肿识别。使用遗传算法在优化集上针对手动计数优化六个算法参数,并在独立的评估集上使用两名独立操作员的计数进行性能评估。
  • 分割模型:使用预训练的nnUNet v2模型从原始微CT扫描中获取肾脏和囊肿掩膜。模型权重(约1.2 GB/模型)可从Zenodo自动下载:https://doi.org/10.5281/zenodo.19097241
  • 支持环境
    • MATLAB:需R2020b或更高版本,以及图像处理、统计与机器学习、并行计算和全局优化工具箱。
    • Python:需3.10或更高版本。
    • R:用于生成Bland-Altman和回归统计图,需readrggplot2dplyr包。

主要功能流程

  1. 参数优化:在优化集上运行遗传算法,优化囊肿计数参数。
  2. 性能评估:在评估集上使用优化后的参数或论文中已发布的参数评估计数性能。
  3. 图像分割:使用预训练的nnUNet模型对原始微CT扫描进行肾脏和囊肿分割。
  4. 囊肿计数:对分割得到的掩膜进行囊肿计数。
  5. 统计分析:生成Bland-Altman图和回归图以评估算法与人工计数的一致性。

相关资源

  • 模型权重:https://doi.org/10.5281/zenodo.19097241
  • 原始扫描数据:与数据集位于同一Zenodo记录中:https://doi.org/10.5281/zenodo.19049543
搜集汇总
数据集介绍
main_image_url
构建方式
在医学影像分析领域,针对多囊肾病(PKD)的囊肿量化研究,CYSTSCAN-PKD数据集通过整合微计算机断层扫描(µCT)图像构建而成。该数据集包含两个主要部分:分割管道与囊肿计数管道。分割管道采用nnUNet v2预训练模型,对来自KRATS和XRATS扫描的原始图像进行自动分割,生成包含肾脏与囊肿标签的掩码;计数管道则基于距离变换峰值检测算法,结合遗传算法优化参数,并利用人工标注的优化集与评估集进行验证,确保了数据标注的准确性与算法泛化能力。
特点
该数据集的特点在于其多层次的结构设计,既提供了原始µCT扫描图像,也包含了经过精细标注的分割掩码与人工计数结果。数据集涵盖两种动物模型(KRATS与XRATS)的扫描数据,并划分为训练集、测试集、优化集和评估集,支持分割与计数任务的全流程验证。此外,数据集附带了预训练的深度学习模型权重与多语言(MATLAB、Python、R)分析工具,实现了从图像预处理到统计可视化的完整研究闭环,为PKD病理量化提供了可靠且可复现的实验基准。
使用方法
使用该数据集时,研究人员可首先通过分割模块处理原始µCT扫描,利用预训练的nnUNet模型生成肾脏与囊肿的分割掩码;随后,囊肿计数管道读取掩码文件,通过遗传算法优化参数或直接采用已发布的参数进行自动囊肿计数。数据集支持MATLAB与Python双平台运行,用户可分别执行优化与评估脚本,并获得Bland-Altman图等统计可视化结果。整个流程遵循模块化设计,从数据下载、模型推理到结果分析均提供了详细步骤,确保了研究过程的高效与可重复性。
背景与挑战
背景概述
在肾脏疾病研究领域,多囊肾病(PKD)作为一种遗传性慢性肾病,其病理特征表现为肾脏中大量囊肿的形成与扩张,严重损害肾功能。针对该疾病动物模型的微观计算机断层扫描(µCT)影像分析,传统上依赖人工标注囊肿,过程繁琐且易受主观偏差影响。CYSTSCAN-PKD数据集由Mangili等人于2026年创建,伴随发表于《Computers in Biology and Medicine》的同行评议论文,旨在提供一套自动化囊肿分割与计数的综合流程。该数据集整合了来自KRATS与XRATS扫描的µCT影像及其对应标注,核心研究问题聚焦于通过距离变换峰值检测与遗传算法优化,实现高精度、可重复的囊肿量化,从而推动PKD病理进展的定量评估与治疗响应监测,为计算生物学与医学影像分析领域提供了重要的基准资源。
当前挑战
该数据集致力于解决多囊肾病µCT影像中囊肿自动分割与计数的核心挑战,其首要难点在于囊肿形态的高度异质性、尺寸分布广泛以及与正常肾组织边界的模糊性,这要求算法具备强大的特征识别与分割鲁棒性。构建过程中的挑战则体现在数据标注的复杂性上,需依赖多位独立操作员进行手动计数以建立金标准,并通过优化集与评估集的双重设计来平衡算法参数优化与性能验证,确保结果的可重复性与统计显著性。此外,跨平台(MATLAB与Python)实现的一致性维护以及大规模模型权重的分发与集成,亦对数据管道的工程化部署提出了技术要求。
常用场景
经典使用场景
在肾脏病学研究领域,CYSTSCAN-PKD数据集为多囊肾病(PKD)的微计算机断层扫描(µCT)图像分析提供了标准化资源。该数据集最经典的使用场景是支持自动化囊肿分割与计数算法的开发与验证。研究者利用其包含的肾脏与囊肿分割掩膜,结合距离变换峰值检测与遗传算法优化,能够高效、准确地量化动物模型中囊肿的数量与分布,从而替代传统依赖人工计数的繁琐流程,显著提升实验数据的可重复性与分析效率。
实际应用
在实际应用层面,CYSTSCAN-PKD数据集及其配套流程可直接服务于临床前药物研发与基础医学研究。例如,在评估潜在疗法对PKD动物模型疗效的实验中,研究人员可利用该流程自动处理大批量µCT扫描图像,快速获取囊肿负荷的客观指标,从而加速候选药物的筛选与验证过程。此外,该技术也有潜力迁移至其他囊性疾病的影像分析中,为病理变化的定量监测提供标准化解决方案,辅助科研人员与制药企业做出更高效、数据驱动的决策。
衍生相关工作
围绕CYSTSCAN-PKD数据集,已衍生出一系列重要的相关研究工作。其核心成果体现在配套论文所提出的集成化处理流程,该流程将基于nnUNet v2的自动分割模块与经遗传算法优化的计数模块相结合,构成了一个端到端的分析体系。此外,该工作促进了µCT影像在肾脏病量化分析中的方法学创新,可能启发后续研究进一步探索三维形态学特征提取、多模态影像融合,或开发更轻量化的模型以适应实时分析需求,持续推动计算病理学在囊性疾病领域的深入发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作