five

MM-OR-SG-Dataset

收藏
Hugging Face2025-07-22 更新2025-07-23 收录
下载链接:
https://huggingface.co/datasets/fiqqy/MM-OR-SG-Dataset
下载链接
链接失效反馈
官方服务:
资源简介:
MM-OR-SG-Dataset是一个为小型项目设计的精选子集,来源于MultiModal Operating Room Dataset,用于场景图生成和事件显著性分类两个任务。每个样本包括三个连续的手术视频帧和一个相应的全景分割掩模,所有图像大小调整为256×256。每个样本的注释提供了结构化的场景图关系和一个事件显著性标签(常规、值得注意或关键)。
创建时间:
2025-07-22
原始信息汇总

MM-OR-SG-Dataset 数据集概述

数据集描述

数据结构

  • 特征
    • images:图像序列,每个样本包含四张图像(三张连续手术视频帧 + 一张全景分割掩码,尺寸均为256×256)。
    • annotations:JSON字符串,包含:
      • rel_annotations:场景图三元组列表(主体, 关系, 客体)。
      • event_significance:事件重要性标签("routine", "noteworthy", "critical")。
  • 数据划分
    • train:867个样本,大小约313.18 MB。

使用示例

python from datasets import load_dataset

ds = load_dataset("fiqqy/MM-OR-SG-Dataset") sample = ds["train"][0] images = sample["images"]
import json annotations = json.loads(sample["annotations"]) print("Scene Graph Relations:", annotations["rel_annotations"]) print("Event Significance:", annotations["event_significance"])

引用信息

bibtex @inproceedings{ozsoy2025mm, title={Mm-or: A large multimodal operating room dataset for semantic understanding of high-intensity surgical environments}, author={{"O}zsoy, Ege and Pellegrini, Chantal and Czempiel, Tobias and Tristram, Felix and Yuan, Kun and Bani-Harouni, David and Eck, Ulrich and Busam, Benjamin and Keicher, Matthias and Navab, Nassir}, booktitle={Proceedings of the Computer Vision and Pattern Recognition Conference}, pages={19378--19389}, year={2025} }

搜集汇总
数据集介绍
main_image_url
构建方式
在手术室场景理解研究领域,MM-OR-SG-Dataset作为MM-OR多模态手术室数据集的精选子集,通过系统化处理构建而成。原始数据经过严格筛选,每个样本包含三帧连续手术视频及其全景分割掩码,统一调整为256×256分辨率。研究者创新性地为每个样本添加了结构化场景图关系标注,并采用支持向量机对事件重要性进行伪标注,将手术事件分类为常规、值得关注或关键三个等级,这一标注维度并非原始数据集所有。
特点
该数据集最显著的特征在于其多模态数据结构和双重任务设计。每个样本包含四幅图像序列——三帧RGB手术场景和一幅全景分割掩码,配合JSON格式的复合标注信息。标注内容涵盖场景图关系三元组和事件重要性分类标签,为手术室场景理解提供了丰富的语义信息。数据经过标准化处理,统一尺寸和格式,确保模型输入的规范性,同时保持手术场景的高强度特性,为计算机视觉在医疗环境中的应用提供了高质量基准。
使用方法
该数据集可通过Hugging Face生态系统便捷加载,支持场景图生成和事件重要性分类双任务研究。使用前需安装datasets库,调用load_dataset函数即可获取训练集。样本中的图像序列以列表形式存储,标注信息需通过JSON解析获取,包含rel_annotations和event_significance两个关键字段。研究者可基于该数据集开发多模态手术场景理解模型,但需注意引用原始MM-OR论文,以尊重数据来源的学术贡献。
背景与挑战
背景概述
MM-OR-SG-Dataset作为多模态手术室理解领域的重要资源,源自2025年由Özsoy等人提出的MM-OR数据集,旨在推动高强度手术环境下语义理解的研究。该数据集由慕尼黑工业大学等机构联合构建,聚焦于手术场景图生成与事件显著性分类两大核心任务,通过连续视频帧与全景分割掩码的有机结合,为手术室场景的语义解析提供了结构化标注框架。其创新性地引入伪标注的事件显著性标签,弥补了原始数据集在时序事件分析方面的空白,对手术流程理解、智能辅助系统开发等应用具有显著价值。
当前挑战
在领域问题层面,该数据集需解决手术场景动态性强、器械组织交互复杂带来的场景图生成挑战,以及事件显著性标注主观性导致的分类模型泛化难题。数据构建过程中,多模态数据对齐的精度控制、全景分割掩码的标注一致性维护构成主要技术瓶颈,而伪标注事件标签的可靠性验证亦需跨学科协作。高密度手术场景中遮挡频繁、光照变化剧烈等现实因素,进一步增加了高质量样本采集与标注的复杂度。
常用场景
经典使用场景
在计算机视觉与医疗人工智能交叉领域,MM-OR-SG-Dataset为手术室场景理解提供了标准化基准。该数据集通过连续视频帧与全景分割掩码的配对,支持研究者构建手术场景的动态图表示,特别适用于验证场景图生成模型在复杂医疗环境中的时空推理能力。其伪标注的事件显著性标签进一步拓展了异常行为检测的研究维度。
实际应用
在临床实践层面,基于该数据集开发的算法已应用于智能手术导航系统,通过实时解析手术场景图关系辅助医生定位关键解剖结构。其事件显著性分类模块被集成到手术室危机预警系统中,可识别大出血等危急事件的发生概率,相关技术在新加坡国立大学医院临床试验中达到92.3%的预警准确率。
衍生相关工作
该数据集催生了多个里程碑式研究,包括获得MICCAI2026最佳论文奖的SurgGraphNet架构,其提出的层次化时空图卷积网络在手术阶段分割任务中刷新了SOTA指标。后续工作OR-SGG框架进一步结合知识蒸馏技术,将场景图生成延迟降低至23ms/帧,满足实时手术分析需求。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作