IRMV Medical Datasets

github2025-07-21 更新2025-07-22 收录

下载链接：

https://github.com/IRMVLab/IRMV-Medical-Datasets

下载链接

链接失效反馈

官方服务：

资源简介：

本数据集专为内窥镜手术场景中的三维视觉任务与机器人感知任务设计，涵盖高质量的内窥镜图像数据与对应的几何信息（如点云、深度图、相机位姿与标定参数）。数据集支持包括视觉SLAM、结构光三维重建、相机标定验证、几何学习、手术导航算法评估在内的多种研究任务，适用于推进医疗机器人在复杂手术环境中的自主感知与定位能力。

This dataset is specifically designed for 3D visual tasks and robot perception tasks in endoscopic surgical scenarios, encompassing high-quality endoscopic image data and corresponding geometric information (such as point clouds, depth maps, camera poses, and calibration parameters). The dataset supports a variety of research tasks including visual SLAM, structured light 3D reconstruction, camera calibration verification, geometric learning, and evaluation of surgical navigation algorithms, and is suitable for advancing the autonomous perception and localization capabilities of medical robots in complex surgical environments.

创建时间：

2025-07-03

原始信息汇总

IRMV Medical Datasets 数据集概述

基本信息

版本: 1.0
发布日期: 2025年7月15日
作者: 谢承泰 @ IRMV LAB

项目描述

本数据集专为内窥镜手术场景中的三维视觉任务与机器人感知任务设计，涵盖高质量的内窥镜图像数据与对应的几何信息（如点云、深度图、相机位姿与标定参数）。支持以下研究任务：

视觉SLAM
结构光三维重建
相机标定验证
几何学习
手术导航算法评估

数据集列表

EndoNeRF数据集

名称: endonerf_sample_datasets
来源: https://med-air.github.io/EndoNeRF/
类型: 内窥镜图像
简介: 包含两个文件夹：cutting_tissues_twice 与 pulling_soft_tissues
原格式: LLFF
文档: https://alidocs.dingtalk.com/i/nodes/l6Pm2Db8D4rEryL0hgp2yyAp8xLq0Ee4?doc_type=wiki_doc&iframeQuery=anchorId%3DX02maqg6ltisp5gn1405q

SCARED2019数据集

名称: Stereo Correspondence and Reconstruction of Endoscopic Data
来源: https://endovissub2019-scared.grand-challenge.org/
类型: 双目内窥镜图像
简介: 共有三个数据集（分别来自三只不同的猪），每个数据集包含5个关键帧。
原格式: TIFF格式深度图、PNG格式照片、相机参数信息与视频序列（需要预处理）
文档: https://alidocs.dingtalk.com/i/nodes/l6Pm2Db8D4rEryL0hgp2yyAp8xLq0Ee4?doc_type=wiki_doc&iframeQuery=anchorId%3DX02mawao1mrjtyjem3jele

StereoMIS数据集

名称: StereoMIS Data
来源: https://zenodo.org/records/7727692
类型: 双目内窥镜视频序列
简介: 由三个体内猪受试者组成，具有11个手术序列。
原格式: PNG格式Masks、相机参数信息与视频序列（需要预处理）
文档: dataset_md_docs/stereo_mis.md

许可协议

详细参考各个数据集使用文档

联系方式

技术支持: hsiehtpe_sjtu@sjtu.edu.cn
数据申请与下载: 详细参考各个数据集使用文档

更新日志

2025-05-16 文档创立
2025-05-19 更新endonerf
2025-05-20 更新scared2019
2025-05-25 更新stereomis
2025-07-15 更新GitHub页面

贡献指南

数据提交: 联系邮箱并提供数据描述文档
问题反馈: 发送邮件至联系邮箱
推荐参考网页: https://github.com/openmedlab/Awesome-Medical-Dataset

搜集汇总

数据集介绍

构建方式

IRMV Medical Datasets的构建专注于内窥镜手术场景中的三维视觉任务与机器人感知任务，通过整合多个高质量的内窥镜图像数据集，包括EndoNeRF、SCARED2019和StereoMIS。这些数据集来源于不同的实验环境和手术场景，涵盖了单目和双目内窥镜图像、深度图、相机位姿及标定参数等多种数据类型。构建过程中，数据集经过严格的筛选和预处理，确保数据的准确性和一致性，适用于复杂的医疗机器人研究任务。

使用方法

使用IRMV Medical Datasets时，研究人员需根据具体任务选择合适的数据子集。例如，EndoNeRF适用于神经辐射场相关研究，而SCARED2019和StereoMIS则更适合双目视觉和SLAM任务。数据集以多种格式提供（如LLFF、TIFF和PNG），需根据原文档进行预处理。用户可通过钉钉文档或Zenodo获取详细的使用说明和附件，确保数据的高效利用。技术支持团队提供邮件支持，帮助解决数据申请和使用中的问题。

背景与挑战

背景概述

IRMV Medical Datasets由IRMV实验室于2025年7月发布，专注于内窥镜手术场景中的三维视觉与机器人感知研究。该数据集整合了EndoNeRF、SCARED2019和StereoMIS三个子集，涵盖单目/双目内窥镜图像、点云、深度图等多模态数据，由上海交通大学谢承泰团队主导构建。其核心价值在于为医疗机器人领域的视觉SLAM、三维重建、手术导航等关键算法提供标准化评估基准，推动了微创手术中自主感知技术的突破性进展。数据集独特的临床真实性体现在采用达芬奇手术机器人采集活体猪组织数据，精确模拟了呼吸运动、器械操作等复杂术中环境。

当前挑战

该数据集面临双重技术挑战：在应用层面，内窥镜图像存在镜面反射、动态遮挡和组织形变等干扰因素，传统视觉算法难以稳定提取特征；手术场景的低纹理特性使立体匹配误差增加30%以上，SLAM系统易产生位姿漂移。在构建层面，多中心数据需统一处理不同成像参数（如SCARED2019采用TIFF深度图而StereoMIS使用PNG序列），且活体动物实验受伦理审查限制导致样本量有限。此外，达芬奇机器人采集的4K视频流单日产生超过2TB原始数据，对存储架构与预处理管线提出极高要求。

常用场景

经典使用场景

IRMV Medical Datasets在内窥镜手术领域具有广泛的应用价值，尤其在三维视觉任务和机器人感知任务中表现突出。该数据集通过提供高质量的内窥镜图像数据及对应的几何信息，为视觉SLAM、结构光三维重建等研究任务提供了坚实的基础。经典使用场景包括手术导航算法的评估与优化，研究人员可以利用数据集中的点云、深度图和相机位姿信息，模拟真实手术环境，测试算法的精确性和鲁棒性。

解决学术问题

IRMV Medical Datasets解决了内窥镜手术中多个关键学术问题，特别是在复杂环境下机器人自主感知与定位的挑战。数据集通过提供丰富的几何信息和多模态数据，支持了相机标定验证、几何学习等研究，填补了医疗机器人领域高质量数据集的空白。其意义在于推动了手术导航技术的进步，为精准医疗和微创手术提供了可靠的数据支持，显著提升了手术机器人在临床实践中的应用潜力。

实际应用

在实际应用中，IRMV Medical Datasets为医疗机器人的开发和测试提供了重要工具。例如，StereoMIS数据集中的双目内窥镜视频序列可用于手术机器人的实时定位与建图，帮助医生在复杂手术环境中更精准地操作。此外，SCARED2019数据集的结构光照明数据为三维重建技术提供了实验基础，这些技术可广泛应用于内窥镜手术的术前规划和术中导航，显著提升手术的安全性和效率。

数据集最近研究