CholecSeg8K

arXiv2025-09-30 收录

下载链接：

https://github.com/YihangZhou123/CASDM-Code-and-Synthetic-Data

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集专为手术场景分割而精心策划，包含了8080张图像及其对应的掩膜，跨越了13个不同的类别。值得注意的是，其中有三个关键类别（血液、胆管、肝静脉）的数据代表性不足。为了应对这一挑战，在模型训练过程中应用了数据增强技术。整个数据集规模涉及8080个图像-掩膜对，覆盖了13个类别，任务专注于手术场景的语义分割。

This dataset is meticulously curated for surgical scene semantic segmentation, containing 8080 image-mask pairs spanning 13 distinct categories. Notably, three key categories—blood, bile duct, and hepatic vein—are underrepresented. To address this challenge, data augmentation techniques were applied during model training. The dataset consists of 8080 image-mask pairs across 13 categories, with its core task focused on surgical scene semantic segmentation.

搜集汇总

数据集介绍

构建方式

在腹腔镜胆囊切除术的计算机辅助手术研究领域，高质量标注数据的稀缺制约了算法发展。CholecSeg8K数据集的构建基于Cholec80数据集，从中精选了17段高度相关的视频片段，提取出8,080帧关键图像。采用PixelAnnotationTool工具，由专业标注人员对每幅图像进行像素级语义分割标注，涵盖腹部壁、肝脏、胆囊、胃肠道等13类手术常见解剖结构与器械。数据以两级目录结构组织，每帧图像均配有原始图像、彩色掩码、标注掩码及分水岭掩码，确保数据的一致性与可编程性。

特点

该数据集专注于腹腔镜胆囊切除术场景，其标注体系针对手术关键目标器官如肝脏与胆囊进行了精细设计，同时兼顾了胃肠道、肝韧带等周边组织的广泛覆盖。数据呈现显著的类别不均衡性，肝脏与腹部壁等背景类别占比显著，而手术器械如抓钳和电钩因物理尺寸较小，标注像素比例不足1%，这反映了真实手术图像的固有分布特性。所有标注均以PNG格式提供，包含可视化与算法处理所需的多重掩码形式，为模型训练提供了丰富的监督信息。

使用方法

研究人员可通过Kaggle平台获取该数据集，其遵循CC BY-NC-SA 4.0许可协议。数据集适用于训练与评估语义分割模型，如FCN、U-Net、DeepLab等架构。在使用时，需注意类别不平衡问题，可采用加权损失函数或过采样等技术以优化模型性能。数据集的层级目录结构与多掩码文件便于直接集成至深度学习管道，支持端到端的训练与验证流程，为手术场景理解、SLAM系统开发等计算机辅助手术应用提供基础支撑。

背景与挑战

背景概述

在计算机辅助手术领域，提升手术精确性与安全性是核心研究目标。由国立台湾大学团队于2020年构建的CholecSeg8K数据集，基于Cholec80视频资源，专注于腹腔镜胆囊切除术的语义分割任务。该数据集包含8,080帧高分辨率图像，每帧均标注了十三类关键解剖结构与手术器械的像素级标签，旨在为手术导航、实时定位与建图等算法提供高质量训练基础。其发布显著推动了内窥镜图像分析研究，为医疗视觉社区提供了稀缺的标注数据资源，促进了智能手术系统的发展。

当前挑战

CholecSeg8K致力于解决腹腔镜手术中器官与器械的精确语义分割难题，其挑战在于内窥镜图像常存在运动模糊、光照不均及组织形变，导致模型分割边界模糊。构建过程中，数据标注面临类别不平衡问题，如肝脏与胆囊占比显著高于小型器械；同时，部分组织如韧带与胃肠道在视觉上相似，需依赖专家知识进行精细区分，标注一致性难以保证。此外，数据集规模受限，未涵盖手术全阶段，可能影响模型在复杂场景中的泛化能力。

常用场景

经典使用场景

在腹腔镜胆囊切除术的计算机辅助手术领域，CholecSeg8K数据集为语义分割任务提供了关键支持。该数据集通过从Cholec80视频中提取的8,080帧图像，标注了包括肝脏、胆囊、腹壁等13类像素级标签，为深度学习模型如U-Net、DeepLab等提供了标准化训练基准。研究者利用这些标注数据，能够精确识别手术场景中的解剖结构和器械，从而推动手术导航与实时分析算法的优化。

衍生相关工作

围绕CholecSeg8K数据集，衍生出多项经典研究工作。例如，基于该数据集的语义分割模型被扩展用于手术阶段识别与器械追踪任务，进一步丰富了Cholec80数据集的标注体系。同时，该数据集促进了跨模态学习方法的探索，如结合时序信息的手术视频分析，推动了内窥镜影像智能处理领域的算法创新与标准化评估框架的建立。

数据集最近研究