ERCPMP
收藏arXiv2023-07-28 更新2024-06-21 收录
下载链接:
https://data.mendeley.com/datasets/7grhw5tv7n/2
下载链接
链接失效反馈官方服务:
资源简介:
ERCPMP数据集是由Shahid Beheshti大学医学科学研究所创建的,专注于结直肠息肉的形态学和病理学研究。该数据集包含191名患者的796张图像和21个视频,涵盖了形态学和病理学数据。数据集的创建过程包括患者诊断、形态学评估、病理学评估等步骤。ERCPMP数据集主要用于开发和训练人工智能算法,以提高结直肠息肉的检测和诊断准确性,从而改善患者的治疗效果。
The ERCPMP dataset was developed by the Institute of Medical Sciences at Shahid Beheshti University, focusing on morphological and pathological research of colorectal polyps. This dataset includes 796 images and 21 videos from 191 patients, covering both morphological and pathological data. The dataset creation process involves steps such as patient diagnosis, morphological assessment, and pathological assessment. The ERCPMP dataset is primarily used for developing and training artificial intelligence algorithms to improve the detection and diagnostic accuracy of colorectal polyps, thereby enhancing patient treatment outcomes.
提供机构:
Shahid Beheshti University of Medical Sciences
创建时间:
2023-07-28
搜集汇总
数据集介绍

构建方式
在结直肠癌早期筛查领域,内镜影像数据的系统性采集与标注对人工智能算法的开发至关重要。ERCPMP数据集的构建遵循严谨的临床研究流程,其核心步骤包括:首先,对191例确诊结直肠息肉患者的临床资料进行采集与匿名化处理,并获取知情同意;其次,在结肠镜检查过程中,使用奥林巴斯内镜设备采集息肉的RGB图像(JPG格式,368*256像素)及视频(MP4格式);随后,依据巴黎分类、Pit pattern、JNET分类等国际标准,由专业医师对息肉进行形态学评估与标注;最后,结合术后病理学诊断结果,将息肉的组织学类型(如管状腺瘤、绒毛状腺瘤、增生性息肉等)及异型增生分级等信息与影像数据精准关联,形成一套包含人口统计学、形态学与病理学多维标签的结构化数据集。
特点
该数据集的突出特点在于其多维度的综合性与临床标注的深度。相较于同类数据集,ERCPMP不仅提供了796张静态图像与21段动态视频,更关键的是,它为每个息肉样本同步整合了基于最新国际标准的形态学分类(如巴黎分类、LST分型)与金标准的病理学诊断结果。这种将内镜下宏观形态特征与微观组织病理学特征进行精确配对的设计,使得数据集能够支持从息肉检测、形态识别到病理性质预测的全链条研究。此外,数据集涵盖了丰富的息肉亚型与分级信息,为开发能够区分良恶性、评估浸润风险的精细化人工智能模型提供了不可多得的训练资源。
使用方法
该数据集主要服务于医学人工智能,特别是计算机辅助诊断系统的研发与验证。研究人员可通过公开的数据门户获取数据集,利用其高质量的图像、视频及配套的标注信息,训练深度学习模型以完成多项任务:例如,基于卷积神经网络实现息肉区域的自动分割与检测;利用多标签分类模型,根据内镜图像预测息肉的巴黎分型或JNET分类;更进一步,可构建端到端模型,尝试从内镜影像中直接推断息肉的潜在病理学诊断,辅助临床决策。数据集的结构化Excel文件便于进行数据筛选与统计分析,支持针对特定息肉亚型的模型性能评估,是推动结直肠癌智能早筛技术发展的关键基准数据。
背景与挑战
背景概述
在结直肠癌全球高发且致死率显著的背景下,早期筛查与精准诊断成为改善患者预后的关键。由伊朗沙希德·贝赫什提医科大学等机构的研究团队于2024年创建的ERCPMP数据集,致力于解决结直肠息肉形态学与病理学自动识别中的核心研究问题。该数据集整合了191例患者的796幅内镜图像与21段视频,并依据巴黎分类、JNET分类等国际标准标注了详细的形态学与病理学特征,填补了该领域缺乏综合性标注数据集的空白,为人工智能在消化内镜中的算法开发提供了重要资源。
当前挑战
在结直肠息肉智能诊断领域,核心挑战在于如何基于内镜影像实现息肉形态与病理类型的精准关联,这对早期癌变风险分层至关重要。ERCPMP数据集的构建过程面临多重挑战:一是数据采集需严格遵循多类国际分类标准(如巴黎、JNET、Kudo pit模式),确保标注的一致性与专业性;二是需协调内镜影像与病理报告的跨模态数据对齐,克服临床信息整合的复杂性;三是数据规模有限且类别分布不均衡,可能影响深度学习模型的泛化能力。
常用场景
经典使用场景
在结直肠癌早期筛查领域,ERCPMP数据集凭借其整合内镜图像、视频与病理标注的独特优势,成为训练人工智能模型进行息肉形态与病理识别的核心资源。该数据集广泛应用于深度学习算法的开发与验证,支持研究者构建自动化系统,以辅助内镜医师在结肠镜检查中实时鉴别息肉性质,从而提升诊断的精确性与效率。
实际应用
该数据集的实际价值体现在临床决策支持与医学教育层面。基于ERCPMP训练的智能系统可集成于内镜平台,实现息肉实时分类与风险预警,辅助制定个性化治疗方案。同时,其丰富的标注数据为内镜医师培训提供了高质量教学案例,有助于提升对息肉形态特征的识别能力与诊断一致性。
衍生相关工作
ERCPMP的发布促进了多项经典研究的诞生,尤其在息肉检测与分类算法领域。研究者利用该数据集开发了基于卷积神经网络的自动分割模型、多模态融合诊断框架,以及结合形态-病理关联分析的预测系统。这些工作不仅验证了数据集的可靠性,也为后续大规模临床验证与算法优化奠定了坚实基础。
以上内容由遇见数据集搜集并总结生成



