five

SegPath

收藏
arXiv2025-01-06 更新2025-01-08 收录
下载链接:
http://arxiv.org/abs/2501.02909v1
下载链接
链接失效反馈
官方服务:
资源简介:
SegPath数据集由东京大学医学部创建,主要用于肿瘤微环境(TME)的分析。该数据集包含59,443张H&E染色图像,涵盖了多种肿瘤类型,如子宫内膜癌、乳腺癌、膀胱癌等。数据来源于1955年至2018年间在东京大学医院接受手术的患者。数据集通过免疫组化重染色技术创建,能够识别14种关键的TME成分。该数据集的应用领域主要集中在癌症生物学研究和临床决策支持,旨在通过大规模组织病理学图像分析,提升对肿瘤微环境的定量理解。

The SegPath dataset, developed by the Faculty of Medicine, The University of Tokyo, is primarily utilized for tumor microenvironment (TME) analysis. This dataset contains 59,443 H&E-stained images spanning a diverse range of tumor types, including endometrial carcinoma, breast cancer, bladder cancer, and others. The data are derived from patients who underwent surgery at The University of Tokyo Hospital between 1955 and 2018. Constructed using immunohistochemical re-staining techniques, the dataset enables the identification of 14 critical TME components. The primary application areas of this dataset cover cancer biology research and clinical decision support, with the goal of advancing quantitative understanding of the tumor microenvironment through large-scale histopathological image analysis.
提供机构:
东京大学医学部预防医学系
创建时间:
2025-01-06
搜集汇总
数据集介绍
main_image_url
构建方式
SegPath数据集的构建基于免疫组化重染色技术,结合现有的分割模型,旨在全面分析肿瘤微环境(TME)。数据集包含来自东京大学医院1955年至2018年间手术患者的H&E染色组织切片,涵盖多种癌症类型。通过组织微阵列(TMA)提取组织区域,生成高分辨率图像,并经过裁剪和缩放处理,最终形成包含59,443张训练图像和3,133张验证图像的数据集。数据集的构建过程中,采用了多模型集成的方法,结合了HoverNet、MIDOG++等模型,确保了细胞类型和组织的多层次分割。
特点
SegPath数据集的特点在于其广泛的细胞类型覆盖和高质量的分割标注。数据集包含14种关键的TME成分,如上皮细胞、平滑肌、淋巴细胞、中性粒细胞等,涵盖了肿瘤微环境中的多种细胞类型。通过免疫组化重染色技术,数据集的标注不仅依赖于形态学特征,还结合了蛋白质表达信息,显著提高了分割的准确性。此外,数据集的多层次细胞分类和实例分割能力使其能够捕捉TME的复杂性和异质性,为肿瘤微环境的定量分析提供了坚实的基础。
使用方法
SegPath数据集的使用方法主要围绕其多层次分割和分类能力展开。用户可以通过PAGET模型进行语义分割或全景分割,分别实现像素级别的细胞类型分类和单个细胞的识别。数据集适用于肿瘤微环境的定量分析,能够快速识别和分类多种细胞类型,支持大规模的病理图像分析。用户可以通过调整模型参数,优化分割结果,并结合临床数据进行肿瘤微环境与基因突变、治疗反应等关联性研究。此外,数据集还可用于开发新的分割算法,进一步提升肿瘤微环境分析的精度和效率。
背景与挑战
背景概述
SegPath数据集由东京大学医学研究科预防医学系的研究团队于2023年创建,旨在通过病理图像分割技术深入分析肿瘤微环境(TME)。该数据集的核心研究问题在于如何从H&E染色的组织切片中准确识别和分类多种细胞类型,以揭示肿瘤微环境的复杂性和异质性。SegPath数据集的构建基于免疫组化重染色技术,结合了多种现有的分割模型,能够同时识别14种关键的TME成分。该数据集在癌症生物学研究和临床决策支持方面具有重要影响力,尤其是在肿瘤微环境的定量分析和免疫细胞空间分布的研究中。
当前挑战
SegPath数据集面临的挑战主要包括两个方面。首先,在领域问题方面,肿瘤微环境的复杂性使得准确识别和分类多种细胞类型变得极为困难,尤其是免疫细胞和基质细胞的区分。现有的分割模型通常依赖于病理学家的形态学注释,容易引入偏差,且难以覆盖所有细胞类型。其次,在数据集构建过程中,免疫组化重染色技术虽然提高了注释的准确性,但无法在同一张组织图像中标注所有细胞类型,导致需要为每种细胞类型开发独立的分割模型,增加了计算资源和时间的消耗。此外,数据集的多样性和规模也对模型的泛化能力提出了更高的要求。
常用场景
经典使用场景
SegPath数据集在肿瘤微环境(TME)分析中具有广泛的应用,特别是在病理图像的自动化分割与分类领域。该数据集通过结合免疫组化重染色技术和现有的分割模型,能够同时识别和分类14种关键的TME成分。其经典使用场景包括在H&E染色组织切片中对肿瘤微环境中的细胞类型进行精确分割,从而支持癌症生物学研究和临床决策。
实际应用
在实际应用中,SegPath数据集被广泛用于癌症诊断和治疗方案的制定。通过其提供的多类细胞分割能力,临床医生可以更准确地评估肿瘤微环境中的免疫细胞分布和空间关系,从而预测患者的治疗反应和预后。此外,该数据集还支持大规模全切片图像(WSI)的分析,为病理学实验室提供了高效的工具,帮助其在临床实践中实现更精准的癌症诊断。
衍生相关工作
SegPath数据集衍生了许多相关研究工作,特别是在肿瘤微环境分析和病理图像分割领域。基于该数据集开发的PAGET模型,结合了语义分割和实例分割的优势,进一步推动了多类细胞分割技术的发展。此外,SegPath还为其他研究提供了高质量的训练数据,支持了诸如HoverNet、MIDOG++等模型在肿瘤微环境分析中的应用。这些衍生工作不仅扩展了SegPath的应用范围,还推动了数字病理学和癌症研究的进步。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作