dsad
收藏Hugging Face2026-03-30 更新2026-03-31 收录
下载链接:
https://huggingface.co/datasets/nct-tso/dsad
下载链接
链接失效反馈官方服务:
资源简介:
德累斯顿手术解剖数据集(DSAD)是一个专注于腹腔镜图像语义分割的医学影像数据集,特别针对机器人辅助直肠切除术中的腹部解剖结构。数据集包含来自32台手术的13,195张图像,每张图像由三位独立标注者标注,并由专家医师审核。数据集提供了11种腹部解剖结构的语义分割掩码,包括腹壁、结肠、肠系膜下动脉、肠静脉、肝脏、胰腺、小肠、脾脏、胃、输尿管和精囊腺。此外,每张图像还包含弱存在标签,指示场景中可见的结构(12种标签,包括11种分割器官和子宫)。数据集分为四种配置:single_organ(默认)和multi_organ包含专家审核的最终掩码;single_organ_multi_rater和multi_organ_multi_rater则提供每位标注者的掩码和STAPLE合并掩码,用于标注者间一致性分析。数据集适用于图像分割和分类任务,特别适合手术数据科学中的器官分割研究。
创建时间:
2026-03-27
原始信息汇总
Dresden Surgical Anatomy Dataset (DSAD) 数据集概述
数据集基本信息
- 数据集名称:Dresden Surgical Anatomy Dataset (DSAD)
- 发布平台:Hugging Face
- 官方论文:发表于 Nature Scientific Data (Carstens et al., 2023)
- 许可证:CC-BY-4.0
- 数据规模:10K < n < 100K
- 主要任务:图像分割、图像分类
- 领域标签:图像、医学、医学影像、外科、外科手术、外科数据科学、腹腔镜、语义分割、器官分割
数据集内容与来源
- 数据内容:提供腹腔镜图像中十一种腹部解剖结构的语义分割掩码。
- 图像来源:来自32台机器人辅助直肠切除术的腹腔镜图像。
- 图像数量:总计13,195张图像。
- 标注信息:每张图像由三名独立标注员标注,并由一名专家医师审核。
- 标注结构:腹部壁、结肠、肠系膜下动脉、肠静脉、肝脏、胰腺、小肠、脾脏、胃、输尿管、精囊腺。
- 额外标签:每张图像包含弱存在标签,指示场景中可见的结构(12个标签,即11个分割器官加上子宫)。
数据集配置
数据集提供四种配置,每种均包含训练集、验证集和测试集划分。
1. single_organ(默认配置)
- 描述:包含13,195张图像,涵盖11个解剖结构。每行对应一张图像和一个单器官的二进制分割掩码,以及弱存在标签。
- 数据列:
surgery_id:手术标识符(01–32)frame_id:手术内的帧编号organ:分割的器官名称image:腹腔镜帧图像(1280x1024 RGB)mask:二进制分割掩码图像(0=背景,255=器官)abdominal_wall...vesicular_glands:布尔型弱存在标签列(共12列,对应11个器官及子宫)
2. multi_organ
- 描述:包含1,430张来自胃部子集的图像,每张图像最多包含7个器官的分割掩码。这些图像因胃部视图常显示多个解剖结构而被选中。并非所有器官在每帧中都可见,非可见器官的掩码为空。掩码可能重叠。
- 数据列:
surgery_id:手术标识符frame_id:帧编号image:腹腔镜帧图像(1280x1024 RGB)mask_abdominal_wall:腹部壁二进制掩码mask_colon:结肠二进制掩码mask_liver:肝脏二进制掩码mask_pancreas:胰腺二进制掩码mask_small_intestine:小肠二进制掩码mask_spleen:脾脏二进制掩码mask_stomach:胃二进制掩码
3. single_organ_multi_rater
- 描述:用于评估者间一致性分析的每位标注员的掩码及STAPLE合并掩码。行与
single_organ配置对应(可通过surgery_id、frame_id、organ连接)。不包含图像以避免重复。 - 数据列:
surgery_id:手术标识符frame_id:帧编号organ:分割的器官名称mask_anno_1:标注员1的掩码mask_anno_2:标注员2的掩码mask_anno_3:标注员3的掩码mask_staple:STAPLE合并掩码(专家审核前)
4. multi_organ_multi_rater
- 描述:用于多器官子集的每位标注员掩码及STAPLE合并掩码。行与
multi_organ配置对应(可通过surgery_id、frame_id连接)。不包含图像以避免重复。 - 数据列:
surgery_id:手术标识符frame_id:帧编号mask_anno_{1,2,3}_{organ}:每位标注员的掩码(3 × 7 = 21列)mask_staple_{organ}:STAPLE合并掩码(7列)- 其中
{organ}为:abdominal_wall、colon、liver、pancreas、small_intestine、spleen、stomach
数据划分
根据手术ID划分,遵循Kolbinger et al. 2024的方法以防止患者信息泄露。
| 划分 | 手术ID | single_organ 图像数 | multi_organ 图像数 |
|---|---|---|---|
| 训练集 | 01, 04–06, 08–10, 12, 15–17, 19, 22–25, 27–31 | 7,889 | 863 |
| 验证集 | 03, 21, 26 | 1,978 | 202 |
| 测试集 | 02, 07, 11, 13–14, 18, 20, 32 | 3,328 | 365 |
相关资源
- 论文DOI:https://doi.org/10.1038/s41597-022-01719-2
- 数据集代码仓库:https://gitlab.com/nct_tso_public/dsad
- 基线代码仓库:https://gitlab.com/nct_tso_public/anatomy-recognition-dsad
引用格式
bibtex @article{carstens2023dresden, title={The dresden surgical anatomy dataset for abdominal organ segmentation in surgical data science}, author={Carstens, Matthias and Rinner, Franziska M and Bodenstedt, Sebastian and Jenke, Alexander C and Weitz, J{"u}rgen and Distler, Marius and Speidel, Stefanie and Kolbinger, Fiona R}, journal={Scientific Data}, volume={10}, number={1}, pages={3}, year={2023}, publisher={Nature Publishing Group UK London} }
搜集汇总
数据集介绍

构建方式
在腹腔镜手术影像分析领域,德累斯顿手术解剖数据集(DSAD)的构建体现了严谨的医学数据采集与标注流程。该数据集源自32台机器人辅助直肠切除术的腹腔镜视频,从中提取了13,195帧高分辨率图像。每帧图像均由三位独立的标注员对十一种腹部解剖结构进行语义分割标注,其后由资深医师进行专家审核,确保了标注的准确性与可靠性。数据集特别提供了单器官与多器官两种标注配置,并额外包含了每位标注员的原始标注及STAPLE算法融合的掩码,为评估标注者间一致性提供了宝贵资源。
特点
德累斯顿手术解剖数据集的核心特点在于其多层次、高质量的标注体系。数据集不仅提供了像素级的语义分割掩码,覆盖腹部壁、结肠、肝脏等关键解剖结构,还附带了每帧图像的弱存在性标签,用以指示场景中可见的器官。其数据以四种配置呈现,包括经过专家审核的最终掩码,以及专为标注者间一致性分析设计的原始标注版本。数据划分严格遵循以手术ID为单位的分割策略,有效避免了患者数据泄露,保障了模型评估的公正性。
使用方法
该数据集为计算机视觉与手术数据科学研究提供了便捷的接入方式。研究者可通过Hugging Face的`datasets`库直接加载,灵活选择单器官分割、多器官分割或包含多位标注者信息的配置。数据加载支持筛选特定器官或启用流式读取以处理大规模数据。对于标注一致性分析,可将包含专家审核掩码的数据表与包含各标注员原始掩码的数据表进行列向拼接,从而在一个统一的数据结构中同时获得金标准与原始标注信息,便于进行深入的定量评估。
背景与挑战
背景概述
在手术数据科学领域,腹腔镜手术图像的精准解剖结构分割是提升手术导航与自动化水平的关键。德累斯顿手术解剖数据集(DSAD)由德累斯顿国家肿瘤疾病中心等机构的研究团队于2023年创建,旨在为机器人辅助直肠切除术中的腹部器官语义分割提供高质量标注资源。该数据集涵盖了来自32台手术的13,195幅图像,对十一种腹部解剖结构进行了精细标注,并由专家医师审核,其发布在《自然·科学数据》期刊上,显著推动了手术视觉理解与智能辅助系统的发展。
当前挑战
该数据集致力于解决腹腔镜图像中多器官语义分割的复杂问题,其核心挑战在于腹部解剖结构在术中常因组织形变、遮挡及光照变化而难以准确识别。构建过程中,研究团队面临标注一致性的难题,通过引入三名独立标注员与专家复审机制来确保标注质量,并采用STAPLE算法融合多标注者结果以量化评估者间一致性。此外,数据划分需严格遵循患者隔离原则,避免信息泄漏,以保障模型评估的可靠性。
常用场景
经典使用场景
在手术数据科学领域,腹腔镜手术影像的精准解剖结构识别一直是核心挑战。德累斯顿手术解剖数据集(DSAD)为此提供了经典的应用场景,即用于训练和评估深度学习模型在机器人辅助直肠切除术中对腹部十一种解剖结构进行语义分割的能力。该数据集通过提供单器官和多器官两种配置,支持从基础分割任务到复杂多器官联合分割的研究,其包含的超过一万三千张由三位独立标注者完成并经过专家审核的图像,为模型训练提供了高质量的监督信号。
实际应用
DSAD的实际应用场景紧密围绕提升手术安全性与智能化水平展开。其直接服务于手术导航系统的开发,通过实时分割并高亮显示腹腔内的关键解剖结构,如输尿管和肠系膜下动脉,能够有效帮助外科医生在复杂手术视野中规避损伤风险。该数据集还可用于构建手术阶段识别或并发症预警系统,通过分析器官的可见性、位置及形态变化,为手术流程监控提供量化依据。此外,基于其数据训练的模型有望集成到手术机器人系统中,实现更精准的器械操控和手术规划。
衍生相关工作
自DSAD发布以来,已衍生出多项具有影响力的研究工作。其本身作为基准,催生了针对手术场景优化的新型分割网络架构与训练策略的探索。相关研究进一步利用其多标注者信息,深入分析了医学图像分割中标注不确定性的建模与利用方法。该数据集也被用于推动手术场景理解(Surgical Scene Understanding)的综合性研究,例如将器官分割与手术动作识别相结合。遵循其数据划分标准的后续研究,为评估模型在跨中心、跨患者数据上的鲁棒性提供了重要范例,促进了手术人工智能临床转化评估框架的完善。
以上内容由遇见数据集搜集并总结生成



