REAL-Colon dataset
收藏arXiv2025-02-06 更新2025-02-11 收录
下载链接:
https://github.com/cosmoimd/temporal_segmentation
下载链接
链接失效反馈官方服务:
资源简介:
REAL-Colon数据集是一个公开的医学影像数据集,由Cosmo Intelligent Medical Devices和Milan Center for Neuroscience共同构建。该数据集包含了60段完整的结肠镜检查视频,共计270万个帧,跨越六个中心的病人群体。数据集经过专业标注,标注内容包括三个结肠镜阶段(外部、插入、撤退)和七个不同的结肠段(盲肠、回肠、升结肠、横结肠、降结肠、乙状结肠和直肠)。这些标注使得计算结肠镜检查的时间、评估结肠段的识别算法以及计算质量度量成为可能,如盲肠和回肠的插管率和BBPS评分。该数据集的建立为结肠镜视频时间分割任务提供了一个重要的基准,推动了相关研究的进展。
The REAL-Colon dataset is a publicly available medical imaging dataset jointly constructed by Cosmo Intelligent Medical Devices and the Milan Center for Neuroscience. This dataset contains 60 complete colonoscopy video clips, totaling 2.7 million frames, spanning patient cohorts from six medical centers. The dataset has been professionally annotated, covering three colonoscopy phases (external, insertion, withdrawal) and seven distinct colonic segments: cecum, ileum, ascending colon, transverse colon, descending colon, sigmoid colon, and rectum. These annotations enable the calculation of colonoscopy procedure durations, the evaluation of colonic segment recognition algorithms, and the computation of quality metrics such as cecal and ileal intubation rates and the BBPS score. The establishment of this dataset provides a critical benchmark for colonoscopy video temporal segmentation tasks, advancing the progress of related research.
提供机构:
Cosmo Intelligent Medical Devices, Dublin, Ireland;Milan Center for Neuroscience, University of Milano–Bicocca, Milano, Italy
创建时间:
2025-02-06
搜集汇总
数据集介绍

构建方式
REAL-Colon数据集的构建方式涉及从60个完整的结肠镜检查视频中提取了270万帧高分辨率图像,这些视频来自六个医疗中心,涵盖了四个不同的队列。这些视频记录了从结肠入口开始到内镜完全从肛门撤出的整个过程。视频数据经过标准化处理,帧率统一为每秒5帧。为了进行时间分割任务,数据集中的每帧都进行了标注,标注内容包括九个类别:三个结肠镜检查阶段(结肠外、插入和撤出阶段)和七个不同的结肠段(盲肠、回肠、升结肠、横结肠、降结肠、乙状结肠和直肠)。标注过程由八名医学图像标注专家在一位胃肠病专家的监督下完成,使用了专业的内部标注工具,确保了标注的一致性和准确性。
使用方法
REAL-Colon数据集可用于结肠镜检查视频的时间分割任务,包括结肠镜检查阶段和结肠段的识别。研究者可以使用该数据集来训练和评估时间分割模型,例如ColonTCN。此外,数据集还支持对结肠镜检查质量指标的自动计算,如撤出时间、盲肠和回肠插管率以及波士顿肠道准备评分。为了使用该数据集,研究者需要下载数据集和标注信息,并按照论文中描述的模型训练和评估协议进行操作。
背景与挑战
背景概述
近年来,随着计算机辅助检测和诊断系统在结肠镜检查中的进步,结肠镜检查程序的自动化报告有望进一步革新临床实践。然而,这些系统开发中的一个关键但尚未充分探索的方面是创建能够自主将全程序结肠镜视频分割成解剖部位和程序阶段的计算机视觉模型。本文旨在创建第一个开放获取的数据集,用于此任务,并提出一种最先进的方法,并与竞争模型进行了基准测试。
当前挑战
结肠镜视频时间分割任务面临多个挑战。首先,由于结肠镜视频通常具有较长的持续时间,且包含大量帧,因此需要能够有效地捕获长时间依赖性的模型。其次,视频帧可能存在较差的可视性,并且某些解剖结构(如盲肠或回肠)可能在不同视频中具有不同的持续时间或完全缺失。此外,模型需要能够处理不同时间尺度上的模式,从几秒到几分钟。这些挑战要求模型能够从长度超过15分钟到1小时或更长的视频序列中有效地捕获全局上下文,并能够区分不同时间尺度上的模式。
常用场景
经典使用场景
REAL-Colon数据集主要用于结肠镜检查视频的时间分割,即将完整的结肠镜检查视频分割为解剖部位和操作阶段。通过这种方式,研究人员可以分析视频帧,提取关键质量指标,如结肠镜检查时间、盲肠和回肠插管率、Boston肠道准备量表(BBPS)评分等。这些指标对于提高腺瘤检测率(ADR)、标准化结肠镜检查程序以及评估结肠镜检查质量至关重要。
解决学术问题
REAL-Colon数据集解决了结肠镜检查视频时间分割这一尚未充分探索的问题。该数据集的创建为研究人员提供了一个公开可用的基准数据集,可以用于训练和评估计算机视觉模型,使其能够自主地对结肠镜检查视频进行时间分割。此外,该数据集还解决了计算机辅助检测(CADe)和诊断(CADx)系统在结肠镜检查中的应用问题,这些系统能够从视频数据中自动提取关键质量指标,并将其纳入自动化报告中,从而提高筛查效果,降低结肠镜检查时间和成本。
实际应用
REAL-Colon数据集的实际应用场景包括:1. 计算机辅助检测和诊断系统:该数据集可以用于训练和评估CADe和CADx系统,以提高腺瘤检测率(ADR)和标准化结肠镜检查程序。2. 结肠镜检查质量评估:通过分析视频帧,研究人员可以计算关键质量指标,如结肠镜检查时间、盲肠和回肠插管率、BBPS评分等,从而评估结肠镜检查质量。3. 结肠镜检查培训:该数据集可以用于培训结肠镜检查医师,帮助他们学习如何识别不同的结肠部位和操作阶段,并提高他们的操作技能。
数据集最近研究
最新研究方向
随着内镜检查辅助诊断和检测系统的发展,结肠镜检查视频的自动化报告正逐步改变临床实践。本研究旨在创建首个开放获取的结肠镜检查视频时间分割数据集,并提出了ColonTCN,一种基于学习的方法,用于有效地捕捉结肠镜检查视频中的长期时间依赖关系。该数据集由60个完整结肠镜检查视频的270万帧组成,经过帧级标签标注,包括九个类别的解剖位置和结肠镜检查阶段。ColonTCN是一种基于学习的架构,采用定制的时序卷积块,旨在高效地捕获长期时间依赖关系,从而实现结肠镜检查视频的时间分割。此外,还提出了一种双重k折交叉验证评估协议,包括在未见过、多中心数据上的模型评估。ColonTCN在分类精度方面达到了最先进水平,同时保持了较低的参数计数,在提出的双重k折交叉验证设置中优于竞争模型。本研究为结肠镜检查程序的时间分割提供了有意义的进展,并推动了进一步开放获取研究以解决这一临床需求。
相关研究论文
- 1A Temporal Convolutional Network-Based Approach and a Benchmark Dataset for Colonoscopy Video Temporal SegmentationCosmo Intelligent Medical Devices, Dublin, Ireland;Milan Center for Neuroscience, University of Milano–Bicocca, Milano, Italy · 2025年
以上内容由遇见数据集搜集并总结生成



