Angelou0516/DAP_Atlas

Name: Angelou0516/DAP_Atlas
Creator: Angelou0516
Published: 2026-04-30 21:19:28
License: 暂无描述

Hugging Face2026-04-30 更新2026-05-03 收录

下载链接：

https://hf-mirror.com/datasets/Angelou0516/DAP_Atlas

下载链接

链接失效反馈

官方服务：

资源简介：

DAP Atlas是一个全身CT扫描数据集，包含533个CT扫描体积，每个体积都有142个解剖结构的标注。数据集来源于AutoPET FDG-PET-CT-Lesions队列，分割掩码由Jaus等人（2023年）通过知识聚合、nnU-Net伪标记和基于解剖学指南的后处理生成。数据集包含CT图像和对应的分割掩码，文件格式为NIfTI，数据集大小为约55GB，许可证为Apache-2.0。数据集的详细信息包括模态（CT）、身体部位（全身）、受试者（482名独特患者）、标签（142个解剖结构）、体积形状（通常为512×512×~390）、间距（约0.8×0.8×2.5mm）等。

DAP Atlas is a whole-body CT dataset with 142 anatomical structures segmented across 533 volumes. The CT images come from the AutoPET FDG-PET-CT-Lesions cohort; the segmentation masks were produced by Jaus et al. (2023) via knowledge aggregation across 14 source datasets, nnU-Net pseudo-labelling, and post-processing using anatomical guidelines. The dataset contains CT images and corresponding segmentation masks in NIfTI format, with a total size of approximately 55GB and licensed under Apache-2.0. Detailed information includes modality (CT), body part (full body), subjects (482 unique patients), labels (142 anatomical structures), volume shape (typically 512×512×~390), spacing (~0.8×0.8×2.5mm), etc.

提供机构：

Angelou0516

搜集汇总

数据集介绍

构建方式

DAP_Atlas数据集的构建源于对全身CT影像精细解剖结构分割的迫切需求。其基础影像数据取自AutoPET FDG-PET-CT-Lesions队列，涵盖482位患者的533个CT容积影像。分割掩膜的生成由Jaus等人通过知识聚合策略实现，整合了14个源数据集的标注信息，并采用nnU-Net进行伪标签生成，最终依据解剖学准则进行后处理优化，从而实现了142种解剖结构的精确标注。

使用方法

使用者可通过HuggingFace Datasets库便捷加载数据，数据以图像分割任务格式组织，包含样本ID、受试者ID、CT中间切片、对应掩膜及其叠加图像等字段。实际应用时，需将`images/`目录下的CT容积文件与`masks/`目录下同名的掩膜文件配对使用，并依据`labels.json`文件中的ID-名称映射进行标签解析。研究者可根据自身需求自定义数据划分，利用此数据集训练或评估全身多器官分割模型。

背景与挑战

背景概述

DAP Atlas（Dense Anatomical Prediction Atlas）是一个专注于全身CT解剖结构精细分割的数据集，由Jaus等人于2023年构建。该数据集源自AutoPET FDG-PET-CT-Lesions队列，涵盖了482名患者的533个CT容积扫描，共标注了142个解剖结构。研究团队通过跨14个源数据集的知识聚合、nnU-Net伪标签生成以及解剖学指导的后处理流程，实现了高精度、高密度的全自动解剖分割。DAP Atlas的发布为全身医学图像分析提供了标准化基准，显著推动了解剖分割模型从单一器官向多器官、全身体域的迁移与泛化，对临床辅助诊断、手术规划及放射治疗具有重要影响。

当前挑战

该数据集所解决的领域挑战在于全身CT图像中142个解剖结构的联合分割，这一任务长期受限于标注成本高昂、解剖变异性大以及不同器官间边界模糊等问题。构建过程中面临的核心挑战包括：1) 跨数据源的知识融合与标注一致性维护，涉及14个差异显著的源数据集；2) 伪标签生成过程中，nnU-Net模型需应对低对比度组织（如腹膜后结构）及性别特异性器官（如前列腺、子宫）的分割难题；3) 解剖学指导的后处理需处理肋骨编号反转（如TotalSegmentator与DAP的对应关系）及缺失ID（如ID 11有意空缺）等细节问题，确保标注的解剖学合理性。

常用场景

经典使用场景

在医学影像分析领域，DAP_Atlas数据集因其覆盖142种解剖结构的全身CT分割标注而成为多器官分割任务的黄金标准。研究者常将其用作训练和评估深度学习模型（如nnU-Net）的基准数据，以提升模型在复杂解剖环境下的精细分割能力。该数据集包含533例来自AutoPET队列的全身CT扫描，体素级标注涵盖了从骨骼、脏器到血管的广泛结构，特别适合开展全自动解剖定位、多器官协同分割以及跨性别条件标签处理等研究。其统一的标注框架和开放的掩膜许可协议，为算法对比与复现提供了标准化平台。

解决学术问题

该数据集核心解决了全身CT影像中高密度、多类别解剖结构自动标注的学术难题。传统手工标注耗时且难以扩展，而现有公开数据集通常仅覆盖少数器官，无法满足全身系统级分析需求。DAP_Atlas通过知识聚合来自14个源数据集的标注信息，结合nnU-Net伪标签技术和解剖学规则后处理，生成了首个涵盖142类精细结构的全身分割数据集。这一创新显著推动了弱监督学习、跨域泛化及大规模标签自动生成等前沿方向的发展，其影响体现在为后续研究提供了可复用的高质量掩膜基准，并启发了性别条件标签等新范式。

实际应用

在实际临床应用中，DAP_Atlas数据集可直接支持全身疾病筛查、放疗规划及手术导航等场景的算法开发。例如，基于其预训练的模型能够自动勾勒放疗靶区周围的关键风险器官，减少手动勾画的耗时与偏差。在PET/CT多模态融合分析中，该数据集提供的精确解剖先验可帮助定位肿瘤病变，提升FDG-PET影像的量化准确性。此外，其Apache-2.0许可协议和TCIA公开CT来源（2025年7月起完全公开）降低了商业转化的法律门槛，为医学影像软件企业构建全自动解剖分析管道提供了高质量训练资源。

数据集最近研究