PolypScene-250
收藏arXiv2025-07-23 更新2025-07-25 收录
下载链接:
https://github.com/ku262/EndoFinder-Scene
下载链接
链接失效反馈官方服务:
资源简介:
PolypScene-250数据集是由复旦大学等研究机构创建的一个新型多视角息肉数据集,旨在推进息肉表征研究。该数据集包含250个息肉案例,其中PolypScene-80子集包含组织病理学注释。数据集通过结合对比学习和重建任务,开发了一个Polyp-aware Image Encoder,以捕获稳健的特征,无需依赖大规模标注数据。此外,EndoFinder框架利用多视角场景表示进行可解释和可扩展的结直肠癌诊断,通过将每个息肉视为三维“场景”,引入Scene Representation Transformer,将息肉的多个视图融合成一个单一的潜在表示,并通过哈希层进行离散化,实现从历史息肉案例数据库中的实时检索。该数据集和框架的发布解决了息肉诊断中的关键挑战,为更高效的AI驱动结肠镜检查流程提供了有希望的途径。
The PolypScene-250 dataset is a novel multi-view polyp dataset developed by Fudan University and other research institutions, with the aim of advancing polyp characterization research. This dataset encompasses 250 polyp cases, and the PolypScene-80 subset within it includes histopathological annotations. By integrating contrastive learning and reconstruction tasks, a Polyp-aware Image Encoder has been constructed to capture robust features without relying on large-scale labeled data. Furthermore, the EndoFinder framework utilizes multi-view scene representation to enable interpretable and scalable colorectal cancer diagnosis: by treating each polyp as a 3D "scene", it introduces the Scene Representation Transformer to fuse multiple views of a single polyp into a unified latent representation, and employs a hash layer for discretization to achieve real-time retrieval from historical polyp case databases. The release of this dataset and framework addresses critical challenges in polyp diagnosis, offering a promising avenue for more efficient AI-powered colonoscopy workflows.
提供机构:
复旦大学
创建时间:
2025-07-23
原始信息汇总
EndoFinder-Scene数据集概述
数据集基本信息
- 数据集名称: EndoFinder: Online Lesion Retrieval for Explainable Colorectal Polyp Diagnosis Leveraging Latent Scene Representations
- 相关论文: 初步版本发表于MICCAI 2024
- 代码仓库: EndoFinder代码
数据集特点
- 扩展内容: 从2D图像检索扩展到2.5D/3D场景检索范式
- 技术方法: 通过将息肉建模为场景并利用多视角捕捉潜在场景表示中的隐式3D信息
数据集组成
- 主要数据集: PolypScene-250 - 新型多视角息肉数据集
- 子集: 包含具有详细组织病理学注释的PolypScene-80子集
模型资源
- 预训练模型: EndoFinder-Scene.pth - 提供训练好的模型用于复现评估结果
使用说明
-
环境配置:
git clone git@github.com:ku262/EndoFinder-Scene.git cd EndoFinder-Scene pip3 install torch torchvision torchaudio pip3 install -r requirements.txt
-
训练命令:
python train.py --batch_size=512 --epochs=200 --output_dir=outputs --finetune=EndoFinder.pth
-
验证命令:
python demo.py --batch_size=64 --resume=EndoFinder_Scene.pth
搜集汇总
数据集介绍

构建方式
PolypScene-250数据集的构建采用了多视角采集策略,通过结肠镜从四个不同角度对250个息肉病灶进行成像。数据采集过程中严格遵循临床操作规范,确保图像质量与视角多样性。每个息肉病例均经过专业医师的形态学标注,并包含80例具有病理学确认的子集。数据集构建创新性地引入了场景表征理念,将二维内窥镜图像序列转化为隐式三维表征,通过自监督对比学习与跨视角重建任务优化特征空间。
特点
该数据集的核心特点在于其多视角场景表征体系,突破了传统单帧息肉分析的局限性。每个息肉病例包含四组配准视图,完整记录病灶的形态学细节与空间特征。数据集特别设计了病理标注子集PolypScene-80,为算法验证提供金标准。数据分布涵盖不同大小、形态的息肉样本,并包含照明条件、黏膜背景等临床常见干扰因素,具有较强的临床代表性。独特的哈希编码方案使数据同时支持高精度匹配与实时检索需求。
使用方法
使用该数据集时,建议采用端到端的场景理解框架进行处理。首先通过预训练的息肉感知编码器提取单视图特征,再经场景表征变换器融合多视角信息。研究者可利用提供的哈希索引实现快速相似病例检索,或基于k近邻算法进行病理分类验证。数据集支持三种应用模式:单视图到多视图匹配、跨视角重识别以及基于场景检索的分类任务,配套的评估指标包含μAP、Top-1准确率等标准化度量。
背景与挑战
背景概述
PolypScene-250数据集由复旦大学基础医学院数字医学研究中心等机构的研究团队于2025年创建,旨在推动结直肠息肉的多视角表征研究。该数据集包含250个息肉样本,每个样本均采集了四个不同视角的内窥镜图像,并包含PolypScene-80子集提供病理学标注。作为计算机辅助诊断领域的重要资源,该数据集创新性地将息肉建模为三维场景,通过场景表示变换器融合多视角特征,为可解释的息肉诊断提供了新的研究范式。其核心研究问题聚焦于解决传统深度学习模型在息肉诊断中面临的标注数据依赖性强和可解释性不足的双重困境,相关成果已发表在医学图像分析领域顶级期刊。
当前挑战
在领域问题层面,PolypScene-250需解决息肉视觉特征与周围结肠组织相似度高导致的低类间差异问题,以及单视角图像无法完整表征三维息肉结构的本质局限。构建过程中面临三大技术挑战:多视角数据采集需严格保证视角多样性与成像质量的一致性;场景表示学习需设计有效的跨视角特征融合机制;哈希检索系统需平衡二进制编码的检索效率与特征保真度。此外,临床实用化还面临实时性要求与诊断准确性之间的权衡挑战,需在亚秒级响应时间内实现精准的相似病例检索。
常用场景
经典使用场景
PolypScene-250数据集在结直肠息肉诊断领域具有重要的应用价值,尤其在多视角息肉识别和分类任务中表现突出。该数据集通过整合不同角度的息肉图像,构建了丰富的三维场景表示,为深度学习模型提供了全面的训练素材。研究人员可利用该数据集进行息肉重识别、病理分类等任务,显著提升了模型在复杂临床环境中的鲁棒性。
衍生相关工作
基于PolypScene-250数据集,研究者们开展了多项创新性工作。EndoFinder框架首次将场景表示学习引入息肉诊断领域,启发了后续的3D感知医学影像分析研究。该数据集还促进了哈希检索技术在医疗图像中的应用,衍生出多种高效的医学图像检索系统。此外,其多视角融合方法为其他医学影像分析任务提供了新的研究思路。
数据集最近研究
最新研究方向
近年来,PolypScene-250数据集在结直肠癌早期诊断领域引起了广泛关注,特别是在多视角息肉表征和可解释性人工智能方向。该数据集通过整合内窥镜多视角图像与病理标注,为基于场景表示的息肉检索范式提供了重要支撑。当前研究热点集中在三个方面:一是利用对比学习与重构任务的自监督策略,从有限标注数据中学习鲁棒的息肉特征;二是将息肉建模为三维场景,通过场景表示变换器融合多视角信息,突破传统单帧分析的局限性;三是在哈希编码加速技术支持下,实现临床可用的实时检索系统。这些进展显著提升了息肉识别的准确率,同时通过检索相似病例的病理报告,为AI诊断提供了直观的可解释依据。该方向的研究正在推动内窥镜影像分析从传统黑箱模型向透明化、可验证的决策支持系统转型。
相关研究论文
- 1EndoFinder: Online Lesion Retrieval for Explainable Colorectal Polyp Diagnosis Leveraging Latent Scene Representations复旦大学 · 2025年
以上内容由遇见数据集搜集并总结生成



