FPPD-13
收藏arXiv2022-12-23 更新2024-06-21 收录
下载链接:
http://endoboost.miccai.cloud
下载链接
链接失效反馈官方服务:
资源简介:
FPPD-13数据集是由复旦大学基础医学院数字医学研究中心发布的一个专门用于计算机辅助结肠镜检查中假阳性抑制的数据集。该数据集包含了13类典型的假阳性案例,共计2600个样本,旨在通过提供真实的临床案例来提高模型的鲁棒性和可靠性。数据集中的样本包括了结肠镜检查中常见的假阳性情况,如血液、粘液、手术后伤口等,以及真阳性样本。通过这个数据集,研究人员可以开发和测试用于实时假阳性抑制的算法,从而提高结肠镜检查的准确性和效率。
The FPPD-13 dataset, released by the Digital Medical Research Center of the School of Basic Medical Sciences, Fudan University, is a specialized resource for false positive suppression in computer-aided colonoscopy. It consists of 2600 samples covering 13 typical false positive cases, aiming to improve the robustness and reliability of models by providing authentic clinical cases. The dataset includes common false positive scenarios in colonoscopy, such as blood, mucus, post-surgical wounds and others, along with true positive samples. With this dataset, researchers can develop and test real-time false positive suppression algorithms, thereby enhancing the accuracy and efficiency of colonoscopy examinations.
提供机构:
复旦大学基础医学院数字医学研究中心
创建时间:
2022-12-23
搜集汇总
数据集介绍

构建方式
在结肠镜计算机辅助息肉检测领域,FPPD-13数据集的构建遵循了严谨的临床实践与专家评审流程。研究团队首先在复旦大学附属中山医院的私有数据集上训练了YOLOv5息肉检测模型,该数据集包含经病理确诊的结直肠增生性息肉、腺瘤及癌症图像,并辅以正常黏膜背景。模型在真实世界结肠镜视频中运行时,捕获所有阳性预测帧,随后由两位经验丰富的内镜医师进行真阳性与假阳性的判别,争议图像则由第三位资深医师仲裁。最终,团队依据临床经验与既往研究,将假阳性归纳为13个类别,共收集2600个样本,其中真阳性与13类假阳性各占一半,每类假阳性包含100个样本,每个样本均附带检测框预测及类别标签。
特点
FPPD-13数据集的核心特点在于其专注于真实世界结肠镜中假阳性样本的系统性归纳与标注。与现有专注于息肉分割或普通胃肠道病变的数据集不同,FPPD-13首次提供了由先进息肉检测模型在实际临床环境中产生的假阳性预测,并构建了一个包含13类假阳性的精细分类体系,涵盖了内镜冲洗、相机模糊伪影、黏液异物、气泡、带血管的肠壁、炎症、出血、粪便、术后创口、器械、皱襞、回盲瓣及阑尾孔等典型类别。该数据集不仅反映了复杂临床场景中模型面临的分布偏移挑战,其均衡的样本构成与详尽的类别标注也为开发鲁棒的后处理假阳性抑制模块提供了宝贵的数据基础。
使用方法
FPPD-13数据集主要用于评估和提升计算机辅助息肉检测系统的鲁棒性。研究人员可利用该数据集对现有检测模型进行‘压力测试’,以衡量其在面对各类真实世界伪影与干扰时的假阳性率。此外,该数据集特别适用于开发后处理的假阳性抑制模块,例如论文中提出的EndoBoost框架。具体而言,可将数据集中真阳性样本视为正常数据,假阳性样本视为异常,利用归一化流等密度估计方法在特征空间学习真阳性的流形分布,并通过似然估计阈值来拒绝假阳性预测。这种基于异常检测的范式,仅需少量甚至无需假阳性样本参与训练,展现出优越的数据效率与对未知假阳性类别的鲁棒性。
背景与挑战
背景概述
在人工智能辅助结肠镜检测领域,高假阳性率一直是临床实践中的主要挑战。为应对这一问题,复旦大学等机构的研究团队于2022年发布了FPPD-13数据集。该数据集聚焦于真实世界结肠镜检测中计算机辅助息肉检测系统产生的假阳性案例,提供了包含13类典型假阳性样本的精细分类体系。其核心研究目标在于通过系统收集和标注假阳性样本,为开发后处理模块以抑制假阳性预测提供数据基础,从而提升AI辅助系统的临床可靠性与鲁棒性。该数据集的发布填补了现有结肠镜数据集中在假阳性样本系统性收集方面的空白,为模型稳健性评估与改进提供了关键资源。
当前挑战
FPPD-13数据集旨在解决计算机辅助息肉检测中假阳性抑制这一核心领域问题。其面临的主要挑战包括:在领域问题层面,模型在开放世界部署中易受分布偏移影响,导致对训练集未见的背景区域产生高置信度错误预测;同时,假阳性类别多样且与真实息肉视觉相似度高,增加了判别难度。在构建过程层面,挑战体现在需从真实临床视频中系统性收集并归类由先进检测器产生的错误预测,并依赖资深内镜医师进行精细标注与审核,以确保数据集的临床代表性与标注质量。此外,数据集中真阳性与假阳性样本的平衡设计,以及涵盖术后伤口、回盲瓣等复杂解剖结构的假阳性类别,进一步增加了数据构建的复杂性与严谨性要求。
常用场景
经典使用场景
在结肠镜计算机辅助息肉检测领域,FPPD-13数据集为研究假阳性抑制提供了关键基准。该数据集收录了真实临床环境中由先进息肉检测模型产生的假阳性案例,涵盖13类典型假阳性类别,如内镜冲洗、气泡、肠道褶皱等。研究人员可利用该数据集对现有检测系统进行“压力测试”,评估模型在复杂临床场景下的鲁棒性,并为开发后处理模块提供标准化评估平台。
实际应用
在实际临床场景中,FPPD-13数据集可直接用于增强AI辅助结肠镜系统的可靠性。通过集成基于该数据集训练的假阳性抑制模块(如EndoBoost),系统能够在实时检测中过滤掉内镜伪影、肠道结构误判等常见干扰,降低内镜医师的视觉疲劳与操作干扰。这种后处理机制无需重新训练原有检测模型,可灵活部署于现有临床工作流,提升结肠镜筛查的效率和准确性。
衍生相关工作
FPPD-13数据集推动了结肠镜图像分析中多个研究方向的发展。基于该数据集,研究者提出了EndoBoost等后处理模块,结合归一化流进行密度估计以抑制假阳性。相关工作还扩展至视频流分析、多中心临床验证等领域,并促进了与EAD、Kvasir等现有数据集的对比研究。这些工作共同深化了对内镜图像异常检测、模型鲁棒性评估及临床部署优化的理解。
以上内容由遇见数据集搜集并总结生成



