five

宫颈癌前病变全切片图像分级基准和组织分类

收藏
arXiv2018-12-26 更新2024-06-21 收录
下载链接:
http://simplab.yildiz.edu.tr/?q=sources
下载链接
链接失效反馈
官方服务:
资源简介:
本数据集由伊斯坦布尔理工大学的信号与图像处理实验室(SIMPLAB)开发,专注于宫颈癌前病变的分级和组织分类。数据集包含957张高分辨率的全切片图像,这些图像来自54名患者的宫颈组织样本,经过病理学家的诊断和标记。数据集的创建旨在通过分析宫颈组织的形态学特征,提高对宫颈癌前病变的诊断准确性。该数据集的应用领域主要集中在医学图像分析和计算机辅助诊断系统的发展,旨在解决宫颈癌前病变的准确分级问题,从而辅助医生进行更精确的诊断和治疗决策。

This dataset was developed by the Signal and Image Processing Laboratory (SIMPLAB) at Istanbul Technical University, focusing on the grading and tissue classification of precancerous cervical lesions. The dataset contains 957 high-resolution whole-slide images, which were collected from cervical tissue samples of 54 patients and diagnosed and annotated by pathologists. It was developed to improve the diagnostic accuracy of precancerous cervical lesions by analyzing the morphological features of cervical tissues. The main application fields of this dataset concentrate on medical image analysis and the development of computer-aided diagnosis systems, aiming to solve the problem of accurate grading of precancerous cervical lesions, thereby assisting clinicians in making more precise diagnostic and treatment decisions.
提供机构:
伊斯坦布尔理工大学
创建时间:
2018-12-26
搜集汇总
数据集介绍
main_image_url
构建方式
在宫颈癌前病变诊断领域,该数据集的构建体现了多学科协作的严谨性。研究团队从伊斯坦布尔梅迪波尔大学医院收集了54名患者的127张高分辨率组织切片,采用全玻片扫描技术获取数字图像。每张切片经苏木精-伊红染色后,由病理学家通过专用图形界面标注基底膜和乳头状结构坐标,并分割为957个小上皮片段。为确保标注可靠性,两位病理学家独立诊断每个片段,当诊断不一致时,借助p16和Ki67免疫组化染色进行最终判定,从而建立了包含正常组织、CIN1、CIN2和CIN3分级的基准数据集。
特点
该数据集的核心特征在于其病理学标注的深度与多维性。它不仅提供了基于CIN和SIL双重分级标准的标注,还完整记录了观察者间差异性数据,这在宫颈病变数据集中较为罕见。数据集包含三种染色模式的图像:常规H&E染色以及p16、Ki67免疫组化染色,为算法提供了互补的形态学与分子表达信息。特别值得注意的是,数据集保留了宫颈上皮乳头状结构区域,这些区域因切面方向易导致诊断分歧,为算法鲁棒性评估提供了关键测试场景。
使用方法
该数据集主要服务于宫颈癌前病变计算机辅助诊断系统的开发与验证。研究者可基于分割后的小上皮片段,提取细胞核面积、核质比、边界不规则性等形态学特征,并利用加权k近邻等算法构建分类模型。数据集的双重标注体系允许研究者分别训练CIN三级分类模型和SIL二分类模型,并通过比较算法诊断与病理学家诊断的一致性,评估模型临床适用性。免疫组化图像可作为不确定病例的辅助验证材料,为算法决策提供可解释性依据。
背景与挑战
背景概述
在数字病理学与人工智能辅助诊断技术深度融合的时代背景下,宫颈癌前病变全切片图像分级基准和组织分类数据集应运而生。该数据集由土耳其伊斯坦布尔技术大学、耶尔德兹技术大学及伊斯坦布尔梅迪波尔大学医院的研究团队于2018年联合创建,旨在应对宫颈上皮内瘤变(CIN)与鳞状上皮内病变(SIL)分级诊断中存在的观察者间差异这一核心临床难题。研究团队通过整合苏木精-伊红染色及p16、Ki67免疫组化染色图像,构建了包含957个上皮组织切片的标准化数据集,为开发计算机辅助诊断系统提供了关键基准。该数据集的发布显著推动了宫颈病变定量形态学分析领域的发展,为病理诊断从主观经验判断向客观量化评估转型奠定了重要基础。
当前挑战
该数据集致力于解决宫颈癌前病变自动化分级诊断中的双重挑战。在领域问题层面,首要挑战在于病理诊断固有的观察者间差异性,不同病理医师对同一病变可能给出CIN1至CIN3的不同分级判断,这种主观差异直接影响诊断一致性与治疗决策。其次,宫颈上皮组织结构中存在的乳头状突起与细胞重叠现象,导致传统图像分析方法难以准确分割细胞核并提取形态学特征。在数据集构建过程中,研究团队面临组织切片制备差异、染色不均匀性等技术挑战,同时需设计专门算法处理细胞重叠问题,并建立多专家标注与免疫组化验证相结合的黄金标准生成机制,确保数据标注的可靠性与临床相关性。
常用场景
经典使用场景
在数字病理学领域,宫颈癌前病变全切片图像分级基准数据集为计算机辅助诊断系统的开发与验证提供了关键资源。该数据集最经典的应用场景在于训练和评估自动化组织分类算法,特别是针对宫颈上皮内瘤变(CIN)和鳞状上皮内病变(SIL)的精确分级。研究者利用其包含的957个小上皮片段的H&E染色图像,以及配套的p16和Ki67免疫组化图像,构建能够模拟病理学家诊断逻辑的计算模型,旨在通过形态计量学特征实现病变的客观、可重复分级。
解决学术问题
该数据集核心解决了宫颈病理诊断中观察者间变异这一长期存在的学术难题。通过提供由两位病理学家独立标注并经由免疫组化确认最终诊断的数据,它使得量化诊断不一致性、并开发减少主观偏差的算法成为可能。此外,数据集专门处理了宫颈上皮乳头状结构和细胞重叠问题,这为开发更鲁棒的细胞核分割与特征提取方法提供了挑战与基准,推动了形态计量学特征与机器学习在宫颈癌早期诊断中的融合研究。
衍生相关工作
该数据集的发布催生了一系列围绕宫颈病变自动分级的经典研究工作。后续研究多在数据集提供的基准上,探索更先进的深度学习方法以替代传统的形态计量学特征工程。例如,基于卷积神经网络(CNN)的端到端分类模型、针对全切片图像(WSI)的多实例学习框架,以及融合多染色(H&E, p16, Ki67)信息的跨模态学习算法。这些衍生工作不仅提升了分级准确率,也推动了整个计算病理学领域向更复杂、更接近临床实际需求的模型架构发展。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务