five

SCORPION

收藏
arXiv2025-07-28 更新2025-07-30 收录
下载链接:
https://doi.org/10.5281/zenodo.16517924
下载链接
链接失效反馈
官方服务:
资源简介:
SCORPION数据集是由Lunit Inc.创建的,旨在评估模型在扫描仪差异下的可靠性。该数据集包含480个组织样本,每个样本使用5种不同的扫描仪进行扫描,共生成2400个空间对齐的图像块。这一设计使得可以隔离扫描仪引起的差异,从而能够严格评估模型在不同扫描仪下的稳定性。SCORPION数据集为评估和改进模型在不同扫描仪下的稳定性提供了重要的资源,有助于推动计算病理学领域的研究。

The SCORPION dataset was developed by Lunit Inc. to assess the reliability of models under scanner-to-scanner variations. It comprises 480 tissue samples, each scanned using 5 distinct scanners, yielding a total of 2400 spatially aligned image patches. This design enables the isolation of scanner-induced discrepancies, allowing for rigorous evaluation of model stability across different scanners. The SCORPION dataset serves as a critical resource for evaluating and improving model stability under varying scanner conditions, and helps advance research in the field of computational pathology.
提供机构:
Lunit Inc.
创建时间:
2025-07-28
原始信息汇总

SCORPION: Addressing Scanner-Induced Variability in Histopathology

数据集概述

  • 发布日期: 2025年7月28日
  • 版本: v1
  • 访问状态: 开放访问
  • 资源类型: 数据集
  • 发布者: Zenodo
  • DOI: 10.5281/zenodo.16517924

创作者

  • 姓名: Jeongun Ryu
  • 所属机构: Lunit

数据集描述

  • 目的: 评估模型在扫描仪变异性下的可靠性。
  • 样本数量: 480个组织样本,每个样本使用5台扫描仪扫描,共生成2,400个空间对齐的补丁。
  • 扫描仪型号:
    • Leica Aperio AT2
    • Leica Aperio GT450
    • Roche Ventana DP200
    • 3DHistech P1000
    • Philips UFS B300
  • 设计特点: 扫描仪配对设计,用于隔离扫描仪引起的变异性,评估模型一致性。

文件信息

  • 文件名: SCORPION_dataset.zip
  • 大小: 644.1 MB
  • MD5校验值: 21e4c586c76a42f3a69b6a5361882a01
  • 下载链接: SCORPION_dataset.zip

附加信息

使用许可

  • 许可证: Creative Commons Attribution 4.0 International

引用信息

  • 引用格式: Ryu, J. (2025). SCORPION: Addressing Scanner-Induced Variability in Histopathology [Data set]. Zenodo. https://doi.org/10.5281/zenodo.16517924
搜集汇总
数据集介绍
main_image_url
构建方式
SCORPION数据集的构建采用了多扫描仪配对设计,旨在精确量化数字扫描仪在组织病理学全切片图像中引入的变异性。研究团队收集了48张H&E染色组织切片,每张切片分别使用5种不同型号的扫描仪(Leica Aperio AT2/GT450、Roche Ventana DP200、3DHistech P1000和Philips UFS B300)进行数字化。通过基于ORB特征提取和仿射变换的配准算法确保空间一致性后,从每张对齐切片中提取10个800µm×800µm区域,并重采样为1024×1024像素的图块,最终形成包含480个样本(每个样本含5个扫描仪配对的图块)、总计2400个图块的数据集。这种严格的空间对齐和多重扫描设计,首次实现了对同一组织区域在不同扫描仪下成像差异的精确比对。
特点
该数据集的核心价值在于其独特的扫描仪配对架构,每个样本包含来自同一组织区域但经不同扫描仪获取的五个严格配对的图像块。这种设计使得研究者能够将扫描仪引起的变异性与组织本身的异质性有效分离,为模型一致性评估提供了受控实验环境。通过特征空间分析表明,即使经过ImageNet预训练的特征提取器,不同扫描仪产生的图像在RGB通道均值和特征分布上仍呈现显著差异。数据集还创新性地提出了配对分析方法,通过设定参考扫描仪并计算相对偏差,更清晰地揭示了扫描仪特异性特征,这种分析方法较传统非配对研究具有显著优势。
使用方法
SCORPION数据集为评估计算病理学模型的跨扫描仪一致性提供了标准化协议。研究者可采用其提出的双重评价指标:通过计算10组扫描仪配对的Dice相似系数,分别获取平均一致性分数(反映整体性能)和最小一致性分数(评估最差场景)。数据集特别适用于结合SimCons等创新框架使用,该框架通过风格增强和一致性损失的协同优化,在保持主要任务性能的同时提升模型鲁棒性。在使用过程中需注意平衡一致性损失系数λ(建议0.3-0.5),以避免模型陷入平凡解的困境。数据集的配对特性还可支持迁移学习研究,通过有限扫描仪数据训练模型,进而评估其在未知扫描仪上的泛化能力。
背景与挑战
背景概述
SCORPION数据集由Lunit Inc.的研究团队于2024年提出,旨在解决计算病理学中因数字扫描仪差异导致的模型泛化问题。该数据集包含480个组织样本,每个样本通过5种不同扫描仪获取,共计2,400个空间对齐的病理图像块。通过这种设计,SCORPION能够精确隔离扫描仪引入的变异性,为评估模型在跨扫描仪环境下的鲁棒性提供了标准化基准。该数据集的推出填补了现有领域空白,为临床部署中模型可靠性的验证提供了关键工具。
当前挑战
SCORPION数据集主要应对两大挑战:其一,在领域问题层面,计算病理学模型易受扫描仪硬件差异(如色彩配置、光学组件)导致的预测不一致性影响,这种变异性可能直接影响临床诊断决策;其二,在构建过程中,研究团队需解决多扫描仪图像的空间对齐难题,通过基于ORB特征的配准算法实现亚像素级精度的跨设备图像匹配。此外,数据集中组织样本的染色异质性进一步增加了跨扫描仪特征解耦的复杂度。
常用场景
经典使用场景
SCORPION数据集在计算病理学领域中被广泛用于评估模型在不同扫描仪间的泛化能力。该数据集通过提供同一组织样本在五种不同扫描仪下的空间对齐图像,使研究者能够精确量化扫描仪引入的变异性。这种独特的设计为开发跨扫描仪一致的深度学习模型提供了基准测试平台,尤其在组织分割和癌症检测任务中展现出重要价值。
衍生相关工作
SCORPION的发布催生了一系列关于医疗图像域适应的创新研究。基于其构建的SimCons框架启发了后续工作如StainConsNet和ScanRobust-Net,这些方法进一步扩展了风格增强与一致性约束的结合方式。数据集还被用作MICCAI2023扫描仪泛化挑战赛的基准,推动了CrossScanner-Adapt等新算法的诞生。
数据集最近研究
最新研究方向
在计算病理学领域,SCORPION数据集的推出标志着对扫描仪诱导变异性的研究迈入了新阶段。该数据集通过提供五种不同扫描仪捕获的空间对齐组织样本,为模型跨扫描仪一致性的评估设立了全新基准。前沿研究聚焦于开发能够消除扫描仪特异性干扰的算法,其中基于风格增强与一致性损失的SimCons框架展现了显著优势,不仅提升了模型在异构扫描设备间的预测稳定性,同时保持了核心任务的性能。这一进展对临床部署具有深远意义,确保了数字化病理诊断系统在不同医疗机构间的泛化能力,为AI驱动的精准医疗奠定了可靠基础。
相关研究论文
  • 1
    SCORPION: Addressing Scanner-Induced Variability in HistopathologyLunit Inc. · 2025年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作