临床病理学数据集
收藏arXiv2024-07-11 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/2407.06508v2
下载链接
链接失效反馈官方服务:
资源简介:
临床病理学数据集由西奈山伊坎医学院创建,包含与癌症诊断和生物标志物相关的临床幻灯片数据。数据集大小为1998条,来源于两所医疗机构的标准医院操作过程中生成的数据。数据集的创建过程涉及从病理学信息系统中提取结构化报告,并进行分类和标记。该数据集主要应用于计算病理学领域,旨在评估和比较公共病理学基础模型的性能,特别是在疾病检测、生物标志物预测和治疗结果预测等临床相关任务中。
This clinicopathological dataset was developed by the Icahn School of Medicine at Mount Sinai, containing clinical slide data associated with cancer diagnosis and biomarkers. Comprising 1998 entries, it is sourced from data generated during standard hospital operations at two medical institutions. The dataset construction workflow involves extracting structured reports from pathology information systems, followed by classification and annotation. Primarily utilized in the field of computational pathology, this dataset aims to evaluate and compare the performance of public foundational pathology models, especially in clinically relevant tasks including disease detection, biomarker prediction, and treatment outcome prediction.
提供机构:
西奈山伊坎医学院
创建时间:
2024-07-09
搜集汇总
数据集介绍

构建方式
本数据集的构建涉及从两家医学中心的临床操作中收集与临床相关终点相关的临床切片,包括癌症诊断和一系列生物标志物。这些切片代表了多种组织和疾病,包括不同解剖部位和器官。为了评估公开的病理学基础模型的性能,研究者们采用了Gated MIL Attention (GMA)模型,并在每个切片上提取了特征表示。然后,使用蒙特卡洛交叉验证策略来估计泛化性能,并对每个模型和任务在20次交叉验证中的验证AUC分布进行了评估。
特点
该数据集的特点在于其多样性,涵盖了多种组织和疾病,包括不同解剖部位和器官。此外,该数据集是从实际临床操作中收集的,反映了真实世界条件下的生物学和技术变异性。数据集包括三种广泛的任务类型:疾病检测、生物标志物预测和治疗结果预测。研究者们使用了多种公开的视觉基础模型,包括CTransPath、UNI、Virchow和Prov-GigaPath,以及一个在ImageNet上预训练的ResNet50模型作为基线。
使用方法
使用该数据集的方法包括采用GMA模型进行特征提取和分类,并使用蒙特卡洛交叉验证来评估模型的泛化性能。研究者们使用单个GPU对模型进行了训练,并使用AdamW优化器和余弦退火学习率调度。对于每个任务和模型,研究者们使用了20次交叉验证的验证AUC分布来评估模型的性能。此外,研究者们还分析了模型大小和计算资源对下游性能的影响。
背景与挑战
背景概述
随着人工智能技术在医学领域的深入应用,病理学数据集的构建和利用显得尤为重要。本文所讨论的临床病理学数据集是由Gabriele Campanella等人在2024年创建的,旨在为计算病理学领域提供一个公开的自我监督学习病理基础模型性能基准。该数据集收集了来自两家医疗中心的临床切片数据,涵盖了多种临床相关的终点,包括癌症诊断和标准医院运营过程中产生的多种生物标志物。该数据集的创建不仅有助于推动计算病理学的研究,也有助于缩小研究与临床应用之间的差距。
当前挑战
尽管自我监督学习在计算机视觉和自然语言处理领域取得了显著成功,但在医学领域的应用仍处于起步阶段。病理学数据集的构建面临着诸多挑战,包括数据集规模相对较小,数字病理学技术的普及率较低,以及数字全切片图像的巨大分辨率带来的分析方法和硬件需求上的挑战。此外,病理学数据集的构建和利用还需要考虑临床数据的多样性和复杂性,以及如何有效地训练和评估病理学基础模型,使其能够在临床工作中可靠地应用。
常用场景
经典使用场景
该数据集主要用于评估和比较临床病理学领域的自监督学习模型。通过在大型临床数据集上进行训练,这些模型能够为各种下游任务提供高质量的预测,如疾病检测、生物标志物预测和治疗结果预测。该数据集为研究人员提供了一个标准化的平台,用于评估不同模型的性能,并指导新模型的训练和选择。
实际应用
该数据集在实际应用中,可用于开发高性能的临床病理学模型。这些模型可以用于辅助医生进行疾病诊断、预测治疗结果和评估生物标志物。通过使用这些模型,可以提高诊断的准确性和效率,并改善患者的治疗效果。
衍生相关工作
该数据集衍生了许多相关的工作,包括不同模型架构的研究、不同预训练算法的比较以及不同数据集大小的评估。这些研究有助于深入了解自监督学习在临床病理学中的应用,并为未来的研究提供了重要的参考和指导。
以上内容由遇见数据集搜集并总结生成



