five

ADPv2

收藏
arXiv2025-07-09 更新2025-08-15 收录
下载链接:
https://zenodo.org/records/15307021
下载链接
链接失效反馈
官方服务:
资源简介:
ADPv2数据集是一个专注于胃肠道组织病理学的数据集,包含从健康结肠活检切片中提取的20,004个图像块,并按照32种不同组织类型的三级层次结构进行了注释。该数据集旨在为计算病理学提供深度学习的训练数据,以增强临床病理诊断的精确度和可重复性。数据集的创建过程涉及从多个医院的健康结肠活检切片中收集全切片图像,并使用在线ADP注释平台进行预处理和注释。ADPv2数据集适用于特定器官的深入研究,可用于发现结肠疾病的潜在生物标志物,并通过分析模型在不同结肠疾病影响的组织上的预测行为,揭示结肠癌发展的两种病理途径的统计模式。

The ADPv2 dataset is a histopathology dataset focused on gastrointestinal tract tissues. It comprises 20,004 image patches extracted from healthy colon biopsy slides, and has been annotated according to a three-level hierarchical structure covering 32 distinct tissue types. This dataset is designed to provide deep learning training data for computational pathology, aiming to improve the accuracy and reproducibility of clinicopathological diagnosis. The creation of the ADPv2 dataset involved collecting whole-slide images from healthy colon biopsy slides across multiple hospitals, followed by preprocessing and annotation using the online ADP annotation platform. The ADPv2 dataset is suitable for in-depth organ-specific research, and can be used to discover potential biomarkers for colon diseases, as well as reveal the statistical patterns of the two pathological pathways underlying colon cancer development by analyzing the predictive performance of models on tissues affected by various colon diseases.
提供机构:
Concordia University, Department of Computer Science & Software Engineering, Montreal, Canada; University of Toronto, Department of Electrical & Computer Engineering, Toronto, Canada; Toronto Metropolitan University, Department of Chemistry & Biology, Toronto, Canada; Université de Montréal, Department of Medicine, Montreal, Canada; Axe Cancer, Centre de recherche du CHUM, Montréal, Canada; Institut de recherche en immunologie et cancérologie, Université de Montréal, Montréal, Canada; Sunnybrook Health Sciences Centre, Anatomic Pathology, Toronto, Canada; University of Toronto, Department of Laboratory Medicine & Pathobiology, Toronto, Canada; Queen’s University, Department of Pathology & Molecular Medicine, Kingston, Canada; Université de Montréal, Department of Pathology & Molecular Medicine, Montréal, Canada
创建时间:
2025-07-08
搜集汇总
数据集介绍
main_image_url
构建方式
ADPv2数据集构建过程基于461张健康结肠活检切片的全视野数字图像(WSI),通过自动化工具提取20,004个非重叠图像块(544×544微米),并采用分层组织学分类法进行标注。数据来源于多中心机构(如TCGA、金斯顿总医院等),涵盖不同染色方案和分辨率。标注过程由专业病理学家监督,采用三级层次化分类体系(32种组织类型),通过在线ADP标注平台实现多标签标注,确保组织结构的精确识别与空间共存关系记录。
特点
ADPv2的核心特点在于其层次化标注体系与多标签设计。数据集包含32种结肠组织类型的精细分类(如腺体、炎症细胞等),每个图像块平均标注10种共存组织类型,反映结肠组织的天然异质性。数据分布呈现右偏特性(90%样本含9种以上标签),并通过共现网络可视化揭示组织间的解剖学关联(如腺体与炎症细胞的强相关性)。此外,数据集严格限定于健康组织样本,为疾病生物标志物研究提供纯净基线。
使用方法
ADPv2支持两阶段深度学习流程:首先采用Barlow Twins方法进行自监督预训练,利用未标注图像块学习通用形态特征;随后通过VMamba架构进行多标签分类微调,采用非对称损失函数(ASL)解决类别不平衡问题。研究者可进一步分析模型在病变组织上的置信度分布偏移(如腺瘤样本的左移特征),探索结肠癌发展的两条病理通路。数据集按8:1:1划分训练/验证/测试集,并禁止跨切片数据泄漏以确保评估可靠性。
背景与挑战
背景概述
ADPv2数据集由加拿大康考迪亚大学、多伦多大学等机构的研究团队于2025年发布,专注于结直肠疾病的组织病理学分析。该数据集包含20,004个从健康结肠活检切片中提取的图像块,采用三级层次结构标注32种组织学组织类型(HTT)。作为计算病理学领域的重要资源,ADPv2填补了现有数据集在胃肠道病理学细粒度标注方面的空白,其独特的健康组织标注策略为探索疾病生物标志物提供了新范式。该数据集通过VMamba架构的多标签分类模型实现了0.88的平均精度(mAP),并成功验证了结肠癌发展的两条病理途径,对数字病理学的算法开发和临床转化研究具有显著价值。
当前挑战
ADPv2面临的挑战主要体现在两个方面:在领域问题层面,结直肠疾病诊断需区分高度相似的息肉亚型(如增生性息肉与管状腺瘤),其组织形态学差异常表现为细微的核排列或腺体结构变化,这对模型的表征学习能力提出极高要求;在构建层面,数据集面临标注复杂性(单图像块平均含10个共存HTT标签)、组织异质性(90%图像块包含9种以上HTT)、以及样本失衡(如淋巴血管通道出现在82%图像块中)等挑战。此外,多中心数据采集导致的染色差异(H&E与HPS染色)和扫描分辨率差异(0.2-0.5mpp)进一步增加了数据标准化的难度。
常用场景
经典使用场景
ADPv2数据集在计算病理学领域中被广泛应用于结直肠疾病的组织学分析。该数据集包含20,004个图像块,每个块都标注了32种层次化的组织学组织类型(HTT),为研究人员提供了丰富的标注数据。经典使用场景包括通过深度学习模型进行多标签分类,以识别和分类结直肠组织中的不同组织类型。此外,ADPv2还被用于自监督学习(SSL)预训练,以解决标注数据不足的问题。
衍生相关工作
ADPv2数据集衍生了一系列相关研究工作,特别是在计算病理学和深度学习领域。基于该数据集,研究人员开发了多标签分类模型,如使用VMamba架构的自监督学习模型。此外,ADPv2还启发了对结直肠疾病生物标志物的研究,通过分析模型预测的置信度分布,揭示了结直肠癌发展的两种病理路径。这些工作不仅验证了ADPv2数据集的实用价值,还推动了计算病理学领域的技术进步。
数据集最近研究
最新研究方向
近年来,ADPv2数据集在计算病理学领域引起了广泛关注,特别是在结直肠疾病的潜在生物标志物发现方面。该数据集通过提供层次分明的组织类型注释,为深度学习模型在病理图像分析中的应用提供了重要支持。前沿研究方向主要集中在利用自监督学习技术(如Barlow Twins)提升模型性能,以及探索VMamba架构在多标签分类任务中的潜力。热点事件包括该数据集在结直肠癌早期诊断和分型中的应用,其影响在于显著提高了病理诊断的精确性和可重复性,为临床决策提供了有力工具。
相关研究论文
  • 1
    ADPv2: A Hierarchical Histological Tissue Type-Annotated Dataset for Potential Biomarker Discovery of Colorectal DiseaseConcordia University, Department of Computer Science & Software Engineering, Montreal, Canada; University of Toronto, Department of Electrical & Computer Engineering, Toronto, Canada; Toronto Metropolitan University, Department of Chemistry & Biology, Toronto, Canada; Université de Montréal, Department of Medicine, Montreal, Canada; Axe Cancer, Centre de recherche du CHUM, Montréal, Canada; Institut de recherche en immunologie et cancérologie, Université de Montréal, Montréal, Canada; Sunnybrook Health Sciences Centre, Anatomic Pathology, Toronto, Canada; University of Toronto, Department of Laboratory Medicine & Pathobiology, Toronto, Canada; Queen’s University, Department of Pathology & Molecular Medicine, Kingston, Canada; Université de Montréal, Department of Pathology & Molecular Medicine, Montréal, Canada · 2025年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作