five

CaDIS|医疗图像分割数据集|手术辅助技术数据集

收藏
arXiv2022-02-22 更新2024-06-21 收录
医疗图像分割
手术辅助技术
下载链接:
https://cataracts-semantic-segmentation2020.grand-challenge.org/
下载链接
链接失效反馈
资源简介:
CaDIS数据集是由数字手术有限公司创建,专注于白内障手术视频的语义分割。该数据集包含4670张来自手术显微镜的图像,涵盖了36个类别,包括29种手术器械、4种解剖结构和3种其他对象。数据集的创建过程涉及手动标注,确保了像素级别的精确分割。CaDIS数据集的应用领域主要集中在计算机辅助干预技术的发展,旨在通过精确的手术场景理解,提高手术安全性和效率。
提供机构:
数字手术有限公司
创建时间:
2019-06-27
AI搜集汇总
数据集介绍
main_image_url
构建方式
CaDIS数据集源自CATARACTS挑战赛的训练视频,涵盖了25个平均时长为10分钟56秒的手术视频,每秒30帧。这些视频记录于2015年1月至9月期间,由Brest大学医院的手术室使用180I相机(Toshiba, 东京, 日本)和OPMI Lumera T显微镜(Carl Zeiss Meditec, 耶拿, 德国)进行录制,聚焦于患者的眼睛。手术由三位不同经验水平的医生执行,患者平均年龄为61岁。数据集通过手动标注生成,包括4670帧图像,涵盖36个类别,其中29个为手术器械,4个为解剖结构,3个为其他对象。标注过程由四位内部艺术家使用商业软件进行,并由医学专家进行质量控制。
特点
CaDIS数据集的显著特点在于其高精度的像素级标注,涵盖了手术场景中的解剖结构和手术器械,适用于语义分割任务。数据集包含36个类别,其中解剖结构类别出现频率较高,而手术器械类别则较为稀疏,导致数据集存在显著的类别不平衡问题。此外,数据集中的手术器械类别具有高度的相似性,增加了分类的难度。
使用方法
CaDIS数据集主要用于训练和评估深度学习模型在白内障手术视频中的语义分割性能。用户可以通过该数据集进行多任务学习,包括解剖结构和手术器械的分割与识别。数据集提供了三种不同的任务设置,分别针对不同的类别分组,以评估模型在不同场景下的表现。用户可以选择使用UNet、DeepLabV3+、UPerNet和HRNetV2等先进的深度学习模型进行实验,并通过mIoU、PA和PAC等指标评估模型的性能。
背景与挑战
背景概述
CaDIS(Cataract Dataset for Image Segmentation)数据集由Maria Grammatikopoulou等人于2020年发布,旨在推动白内障手术视频的语义分割研究。该数据集基于CATARACTS挑战赛的训练视频构建,包含4670张标注图像,涵盖36个类别,包括29种手术器械、4种解剖结构和3种其他对象。数据集的创建得到了Wellcome/EPSRC Centre for Interventional and Surgical Sciences(WEISS)等机构的支持,主要研究人员来自Digital Surgery LTD和Inserm等机构。CaDIS的发布填补了白内障手术场景语义分割数据的空白,为计算机辅助手术(CAI)系统的发展提供了重要支持,尤其是在手术导航、风险评估和术后分析等领域。
当前挑战
CaDIS数据集的构建面临多重挑战。首先,手术视频中的场景复杂,涉及多种手术器械和解剖结构的精确分割,尤其是器械与解剖结构之间的边界模糊问题。其次,数据集的标注过程复杂,需要专业的医学专家和动画师进行像素级标注,确保标注的准确性和一致性。此外,数据集的类别分布不均衡,解剖结构类别占据较大像素比例,而手术器械类别则较为稀疏,导致模型在处理器械类别时面临分类困难。最后,手术器械之间的外观相似性较高,如不同类型的导管,增加了模型区分不同器械的难度。这些挑战使得CaDIS在推动语义分割技术应用于白内障手术场景时面临显著的技术难题。
常用场景
经典使用场景
CaDIS数据集的经典使用场景主要集中在白内障手术视频的语义分割任务中。该数据集提供了4670张带有像素级标注的手术场景图像,涵盖了36个类别,包括29种手术器械、4种解剖结构和3种其他对象。通过这些标注,研究者可以训练深度学习模型,以实现对手术场景中解剖结构和手术器械的精确分割,从而为计算机辅助手术系统提供关键的视觉支持。
实际应用
CaDIS数据集在实际应用中具有广泛的潜力。首先,它可以用于开发和优化手术导航系统,帮助外科医生在手术过程中更精确地定位解剖结构和手术器械。其次,该数据集可用于手术过程中的实时风险评估,通过分析手术器械与解剖结构的交互,及时发现潜在的手术风险。此外,CaDIS数据集还可用于手术培训,通过模拟真实的手术场景,帮助外科医生提升操作技能和应对复杂情况的能力。
衍生相关工作
CaDIS数据集的发布催生了一系列相关的经典工作。首先,基于该数据集的语义分割任务,研究者们开发了多种深度学习模型,如UNet、DeepLabV3+、UPerNet和HRNetV2,这些模型在手术场景分割中表现出色。其次,CaDIS数据集的标注方法和数据结构为其他手术视频数据集的构建提供了参考,推动了手术视频数据的标准化。此外,该数据集还激发了关于手术器械分类和手术过程分析的研究,进一步拓展了计算机辅助手术的应用领域。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国区域地面气象要素驱动数据集 v2.0(1951-2024)

中国区域地面气象要素驱动数据集(China Meteorological Forcing Data,以下简称 CMFD)是为支撑中国区域陆面、水文、生态等领域研究而研发的一套高精度、高分辨率、长时间序列数据产品。本页面发布的 CMFD 2.0 包含了近地面气温、气压、比湿、全风速、向下短波辐射通量、向下长波辐射通量、降水率等气象要素,时间分辨率为 3 小时,水平空间分辨率为 0.1°,时间长度为 74 年(1951~2024 年),覆盖了 70°E~140°E,15°N~55°N 空间范围内的陆地区域。CMFD 2.0 融合了欧洲中期天气预报中心 ERA5 再分析数据与气象台站观测数据,并在辐射、降水数据产品中集成了采用人工智能技术制作的 ISCCP-ITP-CNN 和 TPHiPr 数据产品,其数据精度较 CMFD 的上一代产品有显著提升。 CMFD 历经十余年的发展,其间发布了多个重要版本。2019 年发布的 CMFD 1.6 是完全采用传统数据融合技术制作的最后一个 CMFD 版本,而本次发布的 CMFD 2.0 则是 CMFD 转向人工智能技术制作的首个版本。此版本与 1.6 版具有相同的时空分辨率和基础变量集,但在其它诸多方面存在大幅改进。除集成了采用人工智能技术制作的辐射和降水数据外,在制作 CMFD 2.0 的过程中,研发团队尽可能采用单一来源的再分析数据作为输入并引入气象台站迁址信息,显著缓解了 CMFD 1.6 中因多源数据拼接和气象台站迁址而产生的虚假气候突变。同时,CMFD 2.0 数据的时间长度从 CMFD 1.6 的 40 年大幅扩展到了 74 年,并将继续向后延伸。CMFD 2.0 的网格空间范围虽然与 CMFD 1.6 相同,但其有效数据扩展到了中国之外,能够更好地支持跨境区域研究。为方便用户使用,CMFD 2.0 还在基础变量集之外提供了若干衍生变量,包括近地面相对湿度、雨雪分离降水产品等。此外,CMFD 2.0 摒弃了 CMFD 1.6 中通过 scale_factor 和 add_offset 参数将实型数据化为整型数据的压缩技术,转而直接将实型数据压缩存储于 NetCDF4 格式文件中,从而消除了用户使用数据时进行解压换算的困扰。 本数据集原定版本号为 1.7,但鉴于本数据集从输入数据到研制技术都较上一代数据产品有了大幅的改变,故将其版本号重新定义为 2.0。CMFD 2.0 的数据内容与此前宣传的 CMFD 1.7 基本一致,仅对 1983 年 7 月以后的向下短/长波辐射通量数据进行了更新,以修正其长期趋势存在的问题。

国家青藏高原科学数据中心 收录

Materials Project

材料项目是一组标有不同属性的化合物。数据集链接: MP 2018.6.1(69,239 个材料) MP 2019.4.1(133,420 个材料)

OpenDataLab 收录

全国景区数据

  中华人民共和国旅游景区质量等级共分为五级,从高到低依次为AAAAA、AAAA、AAA、AA、A级五级。5A级景区代表着中国的世界级精品旅游风景区等级。  CnOpenData汇总整理了全国31个省份及直辖市的景区信息,涵盖了景区名称、省份、景区级别、地址、经纬度、简介等字段,为相关研究助力!

CnOpenData 收录

ai-hub2

本项目所使用的数据集名为“ai-hub2”,其主要目的是为改进YOLOv11的工地工程车辆装置检测系统提供高质量的训练数据。该数据集包含五个类别,分别是:钻孔机(boring_machine)、混凝土车(concrete_truck)、起重机(crane)、自卸车(dump_truck)和挖掘机(excavator)。这些类别涵盖了工地上常见的重型机械设备,能够有效支持车辆检测系统在复杂环境中的应用。

github 收录

Subway Dataset

该数据集包含了全球多个城市的地铁系统数据,包括车站信息、线路图、列车时刻表、乘客流量等。数据集旨在帮助研究人员和开发者分析和模拟城市交通系统,优化地铁运营和乘客体验。

www.kaggle.com 收录