Pulmonary Artery-Vein CT Dataset

Name: Pulmonary Artery-Vein CT Dataset
Creator: 中国科学院软件研究所
Published: 2025-01-07 20:03:02
License: 暂无描述

arXiv2025-01-07 更新2025-01-09 收录

下载链接：

http://arxiv.org/abs/2501.03722v1

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是一个大规模的肺动脉和静脉分割数据集，由中国科学院软件研究所等机构的研究人员创建，旨在解决医学图像分析中的血管分割问题。数据集包含718个3D CT扫描，数据格式为NIFTI (.nii.gz)，其中79个扫描为完全标注，639个为半标注。数据集的标注由多名临床医生和放射科医生共同完成，确保了标注的准确性。该数据集的应用领域主要集中在医学图像分析，特别是肺动脉和静脉的自动分割，帮助临床医生进行疾病诊断和治疗规划。

This is a large-scale segmentation dataset for pulmonary arteries and veins, developed by researchers from institutions including the Institute of Software, Chinese Academy of Sciences, aiming to address the challenge of vascular segmentation in medical image analysis. The dataset contains 718 3D CT scans stored in NIFTI (.nii.gz) format, with 79 fully annotated scans and 639 semi-annotated scans. The annotations were jointly finalized by a panel of clinicians and radiologists, guaranteeing their high accuracy. The primary application scenarios of this dataset focus on medical image analysis, particularly for automatic segmentation of pulmonary arteries and veins, to assist clinicians in disease diagnosis and treatment planning.

提供机构：

中国科学院软件研究所

创建时间：

2025-01-07

搜集汇总

数据集介绍

构建方式

Pulmonary Artery-Vein CT Dataset 的构建基于718个3D CT扫描数据，这些数据来自真实世界的医院环境。数据集中包含79个完全标注的CT扫描和639个半标注的CT扫描，标注工作由五名初级临床医生在两名资深放射科医生的监督下完成，并由一名拥有十年以上经验的资深放射科医生进行最终验证和修正。数据以NIFTI格式存储，涵盖了512×512×169到512×512×985的不同切片厚度。数据集的构建旨在为肺动静脉分割任务提供高质量的训练和测试数据。

特点

该数据集是目前最大的肺动静脉CT数据集，具有高度的多样性和复杂性。数据集中包含的CT扫描涵盖了不同的肺部疾病情况，且标注精细，能够有效反映肺动静脉的复杂结构。此外，数据集中包含的半标注数据为模型训练提供了额外的挑战，促使模型在部分标注数据的情况下也能进行有效的学习。数据集的多样性和标注质量使其成为肺动静脉分割任务的理想基准。

使用方法

该数据集主要用于训练和评估肺动静脉分割模型。研究人员可以使用该数据集进行监督学习、半监督学习或弱监督学习的实验。数据集的标注信息可用于训练深度学习模型，如U-Net及其变体，或结合视觉-语言模型（如CLIP）进行跨模态特征融合。通过该数据集，研究人员可以验证模型在肺动静脉分割任务中的性能，并探索如何利用部分标注数据提升模型的泛化能力。

背景与挑战

背景概述

Pulmonary Artery-Vein CT Dataset 是由中国科学院软件研究所、深圳肿瘤医院等多家机构的研究人员共同创建的，旨在解决肺动静脉分割的医学影像分析问题。该数据集包含718个标注的3D CT扫描数据，是目前最大的肺动静脉分割数据集之一。其核心研究问题是通过深度学习技术实现肺动静脉的精确分割，以辅助临床诊断、疾病研究和治疗规划。该数据集的创建标志着肺血管分割领域的一个重要进展，尤其是在减少标注数据需求的同时提升分割精度方面，具有重要的学术和临床意义。

当前挑战

Pulmonary Artery-Vein CT Dataset 面临的挑战主要包括两个方面。首先，肺动静脉分割本身具有极高的复杂性，由于肺血管的树状结构极为复杂，且动脉和静脉在CT图像中的强度值相近，导致分割任务极为困难。其次，数据集的构建过程中也面临诸多挑战，包括如何高效地获取和标注大规模的CT数据，以及如何处理部分标注数据（如仅标注单侧肺血管）带来的训练难题。此外，如何利用预训练的视觉-语言模型（如CLIP）在少量标注数据下实现高性能分割，也是该数据集研究中的关键挑战之一。

常用场景

经典使用场景

Pulmonary Artery-Vein CT Dataset 主要用于医学影像分析领域，特别是肺动静脉的三维分割任务。该数据集通过提供718个标注的CT扫描图像，支持深度学习模型在肺血管结构分割中的训练与验证。其经典使用场景包括基于预训练视觉语言模型（如CLIP）的自适应分割框架，通过融合文本与图像的多模态特征，显著提升了肺动静脉分割的精度。

实际应用

在实际应用中，Pulmonary Artery-Vein CT Dataset 为临床诊断和治疗规划提供了重要支持。例如，在肺栓塞和肺动脉高压等疾病的诊断中，精确的肺动静脉分割能够帮助医生更清晰地观察血管结构，从而制定更有效的治疗方案。此外，该数据集还可用于开发智能辅助诊断系统，提升医疗影像分析的效率与准确性。

衍生相关工作

该数据集衍生了一系列经典工作，特别是在基于视觉语言模型的医学影像分割领域。例如，研究者们通过改进CLIP模型，提出了多种自适应模块和跨模态融合策略，进一步优化了肺动静脉分割的性能。此外，该数据集还推动了半监督学习和弱监督学习方法的发展，为医学影像分析中的标注数据稀缺问题提供了新的解决思路。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集