five

GynSurg

收藏
arXiv2025-06-13 更新2025-06-17 收录
下载链接:
https://ftp.itec.aau.at/datasets/GynSurge/
下载链接
链接失效反馈
官方服务:
资源简介:
GynSurg 是目前最大的妇产科腹腔镜手术多任务数据集,包含152个高清晰度视频,由专家精心标注了四种关键手术动作和两种术中副作用。数据集还包括超过12000帧像素级分割掩码,涵盖了所有常用腹腔镜仪器和四个关键盆腔器官。GynSurg 为研究手术动作识别、仪器和解剖结构分割、术中事件检测和工作流程理解提供了统一资源,旨在推动术中决策支持、术后分析和手术发现的研究进展。

GynSurg is currently the largest multi-task dataset for gynecological and obstetric laparoscopic surgery, consisting of 152 high-definition videos. These videos have been meticulously annotated by experts with four key surgical actions and two intraoperative adverse events. The dataset also includes over 12,000 pixel-level segmentation masks covering all commonly used laparoscopic instruments and four key pelvic organs. GynSurg provides a unified resource for research on surgical action recognition, instrument and anatomical structure segmentation, intraoperative event detection and workflow understanding, aiming to advance research in intraoperative decision support, postoperative analysis and surgical discovery.
提供机构:
Medical University of Vienna Vienna, Austria
创建时间:
2025-06-13
原始信息汇总

GynSurg: 妇科腹腔镜手术数据集概述

数据集简介

GynSurg是一个多任务妇科腹腔镜手术数据集,支持视频手术分析的广泛研究任务。数据集包含高分辨率视频、密集时间标注的手术动作和副作用,以及手术器械和解剖结构的像素级分割掩码。

数据集组成

动作识别数据集

  • 视频来源:152个妇科腹腔镜手术视频,来自维也纳医科大学和多伦多大学医学中心的600多个手术记录。
  • 视频规格:30帧/秒,分辨率1920*1080像素。
  • 标注内容
    • 四个关键手术动作:凝固、针穿、吸引/冲洗、横切。
    • 两个术中副作用:出血和烟雾。
  • 用途
    • 多类动作识别。
    • 副作用识别。

语义分割数据集

器械分割

  • 视频来源:10个标注视频,来自多伦多大学医学中心。
  • 视频规格:11,352帧,分辨率750*480像素。
  • 标注内容:21种器械类别,分为:
    • 主要手术器械(13类):包括抓钳、缝合器、剪刀等。
    • 辅助工具(8类):包括套管、夹子等。

解剖结构分割

  • 视频来源:5个标注视频。
  • 视频规格:1,010帧,分辨率750*480像素。
  • 标注内容:4种解剖结构(子宫、卵巢、输卵管、器官)。

未标注视频

  • 内容:75个高清腹腔镜子宫切除术视频(1920*1080)。
  • 用途:支持半监督和自监督学习研究。

下载信息

动作识别数据集

  • GynSurg_Action_Recognition_(3sec_clips) (~24 GB)
  • GynSurg_Action_Recognition_segments (~46 GB)

语义分割数据集

  • GynSurg_Instrument_Dataset (~2.5 GB)
  • GynSurg_Auxiliary_Tool_Dataset (~750 MB)
  • GynSurg_Anatomy_Dataset (~350 MB)
  • Instrument_Anatomy_Dataset (~10 GB)

未标注视频

  • 需签署数据使用协议后联系Assoc. Prof. DI Dr. Klaus Schoeffmann获取。

使用条款

  • 许可协议:CC BY-NC 4.0。
  • 使用限制:仅限非商业科学研究。
  • 引用要求:使用数据集需引用指定文献。

免责声明

数据集仅限科学研究用途,禁止商业使用。如需其他用途,需直接联系视频原作者。

搜集汇总
数据集介绍
main_image_url
构建方式
GynSurg数据集的构建基于152例高清妇科腹腔镜手术视频,这些视频选自维也纳医科大学和多伦多大学医学中心记录的600余例手术过程。视频以每秒30帧、1920×1080像素的分辨率采集,并由临床专家对四种关键手术动作(电凝、针穿、吸引/冲洗、切断)和两种术中副作用(出血、烟雾)进行了精细的时间标注。此外,数据集还包括超过12,000帧的像素级分割掩模,覆盖了21种常用腹腔镜器械和四个关键盆腔器官。通过整合时间和空间标注,GynSurg为手术视频分析提供了统一的多任务评估资源。
特点
GynSurg数据集以其规模和多样性著称,是目前妇科腹腔镜手术领域最全面的多任务数据集。其特点包括:1)覆盖四种核心手术动作和两种常见术中副作用的密集时间标注;2)提供21种手术器械和四种解剖结构的像素级分割;3)包含75例未标注视频以支持半监督学习研究。数据集通过标准化协议实现了动作识别与语义分割任务的端到端评估,其标注质量与临床相关性得到了专业验证。
使用方法
该数据集支持多种计算机辅助手术分析任务的使用方式。对于动作识别,视频被分割为3秒片段(1秒重叠)进行五分类(含静止状态)或副作用二分类任务;语义分割任务提供256×256像素的标准化输入,支持器械、辅助工具和解剖结构的像素级预测。研究人员可采用四折交叉验证协议,使用提供的训练ID和开源代码进行模型开发。数据集遵循CC BY-NC-ND许可,通过专用FTP和GitHub仓库提供完整访问。
背景与挑战
背景概述
GynSurg数据集由奥地利克拉根福大学、瑞士伯尔尼大学以及维也纳医科大学的研究团队于2025年联合发布,是当前妇科腹腔镜手术领域规模最大、标注最全面的多任务数据集。该数据集包含152例高清手术视频,覆盖凝血、穿针、吸引/冲洗和离断四种核心手术动作,以及出血和烟雾两种术中副作用,同时提供12,362帧像素级标注的器械与器官分割掩膜。其创新性在于首次整合了时序动作识别与空间结构分割的双重标注体系,解决了既往数据集规模有限、任务单一、标注粒度不足的痛点,为手术流程分析、智能辅助决策等研究提供了标准化评估基准。
当前挑战
在领域问题层面,GynSurg需应对手术视频中动作类别严重不均衡(如穿针动作占比达25.2%)、术中视觉干扰(烟雾、血液遮挡等)以及解剖结构形变等核心挑战;数据构建过程中,研究团队需克服多中心数据异构性(采集自维也纳与多伦多两家医学中心)、21类手术器械的精细标注一致性,以及妇科器官动态形变导致的标注边界模糊等难题。实验表明,即使采用ResNet3D等先进模型,子宫分割的Dice系数仍低于65%,突显复杂解剖环境下的算法优化空间。
常用场景
经典使用场景
在妇科腹腔镜手术领域,GynSurg数据集通过提供152例高清手术视频及12,362帧像素级标注图像,成为研究手术动作识别、器械分割和器官分割的多任务基准平台。其标注覆盖了凝血、穿针、吸引/冲洗和横断四种核心手术动作,以及出血和烟雾两种术中副作用,为算法开发提供了丰富的时空上下文信息。数据集特别适用于开发能够理解复杂手术工作流的智能系统,例如通过分析器械与组织的交互模式来预测手术阶段。
解决学术问题
该数据集有效解决了妇科腹腔镜视频分析中的三大瓶颈问题:现有数据规模小导致的模型泛化性不足、单任务标注限制跨任务联合优化、以及缺乏精细解剖结构标注。通过提供多模态标注(时间动作标签+空间分割掩码),GynSurg支持端到端的工作流分析研究,使模型能同时学习器械定位、组织识别与动作时序关系。其标注的21种器械和4种器官尤其有助于探索手术场景理解中的长尾分布问题。
衍生相关工作
该数据集已催生多个创新性研究:Nasirihaghighi等人提出的混合Transformer架构在动作识别任务中达到92.7%准确率;基于SAM的弱监督分割方法在器械分割上实现90.48% Dice系数。相关成果发表在MICCAI等顶级会议,推动了手术视频分析从单一工具检测向多模态语义理解演进。团队开源的训练协议与四折验证划分已成为领域标准评估方案。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作