AMi-Br, AtNorM-Br, AtNorM-MD

Name: AMi-Br, AtNorM-Br, AtNorM-MD
Creator: 德国弗伦斯堡应用科学大学, 奥地利维也纳兽医大学, 美国纽约施瓦茨曼动物医学中心, 法国巴黎Diffusely, 德国柏林自由大学, 德国英戈尔施塔特技术高等专业学院, 奥地利维也纳医科大学, 德国维尔茨堡尤利乌斯-马克西米利安大学
Published: 2025-06-27 00:30:42
License: 暂无描述

arXiv2025-06-27 更新2025-06-28 收录

下载链接：

https://github.com/DeepMicroscopy/AMi-Br_Benchmark

下载链接

链接失效反馈

官方服务：

资源简介：

AMi-Br数据集包含3,720个人类乳腺癌细胞分裂图像，AtNorM-MD数据集包含2,107个来自人类和犬类肿瘤的细胞分裂图像，AtNorM-Br数据集包含746个来自乳腺癌患者队列的细胞分裂图像。这些数据集用于评估深度学习模型在识别异常和正常有丝分裂方面的性能。数据集的创建过程涉及多位病理学家的专家投票，以确保分类的准确性。这些数据集的应用领域是癌症研究，旨在解决异常有丝分裂分类的问题，这对于评估肿瘤的恶性和预后具有重要意义。

The AMi-Br dataset contains 3,720 human breast cancer cell division images. The AtNorM-MD dataset encompasses 2,107 cell division images derived from human and canine tumors, whereas the AtNorM-Br dataset comprises 746 cell division images from a cohort of breast cancer patients. These datasets are developed to evaluate the performance of deep learning models in discriminating between abnormal and normal mitoses. The creation of these datasets involved expert consensus voting from multiple pathologists to validate the accuracy of classification annotations. Their application domain lies in cancer research, with the core objective of addressing the challenge of abnormal mitosis classification, which is critically important for assessing tumor malignancy and patient prognosis.

提供机构：

德国弗伦斯堡应用科学大学, 奥地利维也纳兽医大学, 美国纽约施瓦茨曼动物医学中心, 法国巴黎Diffusely, 德国柏林自由大学, 德国英戈尔施塔特技术高等专业学院, 奥地利维也纳医科大学, 德国维尔茨堡尤利乌斯-马克西米利安大学

创建时间：

2025-06-27

原始信息汇总

AMi-Br_Benchmark 数据集概述

数据集背景

研究主题：利用深度学习和视觉基础模型进行非典型与正常有丝分裂分类的基准测试与跨数据集评估
核心挑战：非典型有丝分裂的低发生率、与正常有丝分裂的形态差异小、病理学家间低一致性以及数据集类别不平衡
研究贡献：提出了基于AMi-Br数据集的全面基准比较，并引入两个新的保留数据集AtNorM-Br和AtNorM-MD

包含数据集

AtNorM-Br/
- 来源：TCGA乳腺癌队列中的非典型和正常有丝分裂
- 特点：跨数据集评估用保留集
AtNorM-MD/
- 来源：MIDOG++训练集中的多领域有丝分裂数据
- 特点：包含非典型和正常有丝分裂的多领域数据集

性能表现

AMi-Br数据集平均平衡准确率：0.8135
AtNorm-Br数据集平均平衡准确率：0.7696
AtNorM-MD数据集平均平衡准确率：0.7705

方法学特点

采用基础模型的线性探测和低秩适应(LoRA)微调
Virchow系列基础模型的LoRA适配表现优异

相关资源

论文链接：https://arxiv.org/abs/2506.21444v1
代码和数据集已全部开源

搜集汇总

数据集介绍

构建方式

AMi-Br、AtNorM-Br和AtNorM-MD数据集的构建基于多源病理图像数据，采用专家标注与多数投票机制确保标签可靠性。AMi-Br整合了TUPAC16和MIDOG21数据集中的3720个有丝分裂图像，由三位病理学家通过多数投票标注；AtNorM-MD涵盖人类与犬类六种肿瘤类型的2107个样本，采用五位专家投票标注；AtNorM-Br则从TCGA乳腺癌队列中提取746个样本，由单一资深专家标注。所有图像统一预处理为224×224像素，并通过分层交叉验证划分数据以避免患者级数据泄漏。

使用方法

研究采用五折交叉验证框架，对比了端到端训练模型（EfficientNetV2、ViT、Swin Transformer）、基础模型的线性探测（Linear Probing）及低秩自适应微调（LoRA）三种范式。图像经标准化增强处理，模型选择基于验证集平衡准确率，并采用加权采样缓解类别不平衡。特别地，LoRA微调通过冻结主干网络、仅更新低秩矩阵参数，在Virchow等基础模型上实现了最优性能（AMi-Br达0.8135平衡准确率）。数据集适用于评估模型在跨域泛化、小样本学习及病理认知一致性等关键场景的表现。

背景与挑战

背景概述

AMi-Br、AtNorM-Br和AtNorM-MD数据集由Sweta Banerjee等研究人员于2025年提出，旨在解决组织病理学中非典型有丝分裂（AMF）与正常有丝分裂的分类问题。这些数据集由德国弗伦斯堡应用科学大学、维也纳兽医大学等多个国际机构联合开发，核心研究聚焦于利用深度学习模型提升AMF识别的准确性与泛化能力。AMi-Br包含3,720个人类乳腺癌有丝分裂图像，通过多专家标注解决了低流行率和类不平衡问题；AtNorM-Br和AtNorM-MD则进一步扩展至多域数据，涵盖人类和犬类肿瘤样本。这些数据集通过引入跨域评估框架，显著推动了肿瘤恶性程度预后标记的自动化分析，并为计算病理学中的模型泛化研究提供了重要基准。

当前挑战

非典型有丝分裂分类面临多重挑战：领域问题上，AMF与正常有丝分裂的形态差异细微且存在重叠，导致病理学家间标注一致性低（AMi-Br专家一致率仅78.2%），而数据集的类不平衡（如AtNorM-MD中AMF占比10.4%）进一步加剧模型训练偏差。构建过程中，跨域数据整合困难，AtNorM-MD需协调人类与犬类肿瘤的异质性，且不同来源图像的扫描协议与分辨率差异（如H-Optimus模型因分辨率不匹配性能下降）引入了显著领域偏移。此外，单专家标注的AtNorM-Br可能存在系统性偏差，而多专家标注的AMi-Br仍需通过投票机制缓解主观性，这些因素共同制约了模型的鲁棒性与可重复性。

常用场景

经典使用场景

在计算病理学领域，AMi-Br、AtNorM-Br和AtNorM-MD数据集被广泛应用于非典型与正常有丝分裂的分类研究。这些数据集通过提供大量标注的有丝分裂图像，为深度学习模型在自动识别非典型有丝分裂图像（AMF）方面提供了重要的训练和评估基础。特别是在乳腺癌和其他肿瘤类型的病理分析中，这些数据集帮助研究者开发出能够准确区分正常和非典型有丝分裂的算法，从而为肿瘤的恶性程度评估提供客观依据。

解决学术问题

这些数据集解决了病理学中非典型有丝分裂识别中的多个关键问题，包括低发生率、形态学差异细微、标注者间一致性低以及数据集类别不平衡等挑战。通过提供多专家标注的大规模数据，它们显著提高了模型的分类性能，并在跨数据集评估中展示了良好的泛化能力。此外，这些数据集还支持了基于迁移学习和模型微调技术的研究，为非典型有丝分裂分类的标准化和自动化提供了重要工具。

实际应用

在实际应用中，AMi-Br、AtNorM-Br和AtNorM-MD数据集被用于开发临床病理诊断工具，帮助病理学家快速准确地识别非典型有丝分裂，从而提升肿瘤分级和预后评估的效率和准确性。特别是在乳腺癌和多种其他肿瘤的诊断中，这些数据集支持的算法能够辅助病理学家减少主观误差，提高诊断一致性，并为大规模病理数据分析提供了可能。

数据集最近研究