Cataract-1K
收藏arXiv2023-12-11 更新2024-06-21 收录
下载链接:
https://synapse.org/
下载链接
链接失效反馈官方服务:
资源简介:
Cataract-1K数据集是由医学人工智能中心(CAIM)创建,包含1000个白内障手术视频,旨在支持场景分割、阶段识别和异常检测。数据集涵盖多种手术阶段和工具的像素级标注,以及两种主要手术异常的子集。创建过程涉及视频录制和详细标注,以确保数据质量。该数据集主要用于开发和评估计算机辅助手术系统,特别是在白内障手术中的应用,以提高手术效率和安全性。
The Cataract-1K dataset was developed by the Center for Artificial Intelligence in Medicine (CAIM), which consists of 1000 cataract surgery videos. It is designed to support tasks including scene segmentation, phase recognition and anomaly detection. The dataset provides pixel-level annotations covering various surgical phases and surgical tools, as well as subsets of two primary surgical anomalies. The creation of the dataset involves video recording and rigorous annotation to guarantee data quality. This dataset is mainly utilized for developing and evaluating computer-assisted surgery systems, particularly for applications in cataract surgery to enhance surgical efficiency and safety.
提供机构:
医学人工智能中心(CAIM)
创建时间:
2023-12-11
搜集汇总
数据集介绍

构建方式
Cataract-1K数据集由2021年至2023年间在奥地利克拉根福大学眼科诊所进行的1000例白内障手术视频组成。该数据集提供了大规模的语义分割标注,涵盖了不同手术阶段和相关解剖结构,以及手术中可能出现的两种主要异常情况(如人工晶状体旋转和瞳孔收缩)。此外,数据集还包括56个手术视频的手术阶段标注和30个手术视频的像素级标注,用于语义分割任务。所有视频的编码分辨率为512×324,帧率为25 fps。
特点
Cataract-1K数据集的显著特点是其多任务标注的全面性,涵盖了手术阶段识别、场景分割和异常检测。数据集不仅提供了手术视频的语义分割标注,还特别关注了手术中的异常情况,如人工晶状体旋转和瞳孔收缩。此外,数据集的标注质量通过多种最先进的神经网络架构进行了基准测试,确保了其在深度学习模型训练中的可靠性。
使用方法
Cataract-1K数据集可用于多种计算机辅助手术任务,包括手术阶段识别、场景分割和异常检测。研究者可以使用该数据集训练深度学习模型,以实现对手术视频的自动分析,如手术阶段的分类、手术器械和解剖结构的分割,以及手术中异常情况的检测。数据集的标注文件以CSV和JSON格式提供,便于研究者进行数据预处理和模型训练。
背景与挑战
背景概述
近年来,深度学习技术在计算机辅助手术和术后手术视频分析领域取得了显著进展,尤其是在白内障手术中,深度学习方法的应用潜力巨大。白内障手术作为全球最常见的眼科手术之一,其手术过程复杂且对患者生活质量影响深远。Cataract-1K数据集由瑞士伯尔尼大学医学中心的人工智能医学中心(CAIM)和奥地利克拉根福大学的研究人员共同创建,旨在通过提供大规模的白内障手术视频数据集,推动计算机辅助手术(CAI)技术的发展。该数据集包含1000个手术视频,涵盖了手术场景分割、手术阶段识别以及手术异常检测等多项任务,为深度学习模型在白内障手术中的应用提供了丰富的数据支持。
当前挑战
Cataract-1K数据集的构建面临多重挑战。首先,手术视频中的手术阶段识别任务由于不同阶段使用的器械相似度高,导致分类模型的类别间差异较小,增加了识别难度。其次,手术视频中的阶段分布极不平衡,最长阶段(如超声乳化阶段)和最短阶段(如切口阶段)的时长差异显著,进一步加大了模型训练的难度。此外,视频中可能存在的失焦模糊、运动模糊以及缺乏元数据等问题,也增加了数据处理的复杂性。最后,不同患者眼部视觉特征的差异性,导致视频间的分布差异较大,需要更多的训练数据以确保模型的泛化能力。
常用场景
经典使用场景
Cataract-1K数据集的经典使用场景主要集中在白内障手术视频的分析与理解上。该数据集通过提供大规模的手术视频及其详细的标注,支持手术场景分割、手术阶段识别以及手术异常检测等任务。研究者可以利用这些标注数据训练深度学习模型,以实现对手术视频的自动分析,从而提升手术过程的监控与评估效率。
解决学术问题
Cataract-1K数据集解决了白内障手术视频分析中的多个关键学术问题。首先,它填补了现有数据集中多任务标注的空白,使得研究者能够同时进行手术场景分割、阶段识别和异常检测等多项任务。其次,该数据集通过提供大规模的标注数据,推动了深度学习技术在手术视频分析中的应用,特别是在手术异常检测和手术阶段自动识别方面,为提升手术质量和安全性提供了新的研究方向。
衍生相关工作
Cataract-1K数据集的发布催生了一系列相关研究工作。例如,基于该数据集的手术阶段识别和场景分割任务,研究者提出了多种深度学习模型,如CNN-RNN框架和多任务学习模型,以提升手术视频分析的准确性。此外,该数据集还推动了手术异常检测的研究,特别是在白内障手术中常见的瞳孔反应和人工晶状体旋转等异常情况的自动检测。这些研究不仅丰富了手术视频分析的算法库,还为未来的手术辅助系统开发奠定了基础。
以上内容由遇见数据集搜集并总结生成



