Histo-VL

Name: Histo-VL
Creator: Mohamed Bin Zayed University of Artificial Intelligence
Published: 2025-03-17 17:45:22
License: 暂无描述

arXiv2025-03-17 更新2025-03-19 收录

下载链接：

https://github.com/Histo-VL/benchmark

下载链接

链接失效反馈

官方服务：

资源简介：

Histo-VL是一个全面的开源基准数据集，包含使用多达11种不同采集工具获得的图像，并与精心制作的包含类别名称和多种病理描述的文本配对。该数据集涵盖了26个器官，31种癌症类型，来自14个异质患者队列的多种组织，总计超过500万个小块，这些小块是从超过41K个WSIs中观察到的，并在不同的放大倍数下查看。

Histo-VL is a comprehensive open-source benchmark dataset that comprises images acquired with up to 11 distinct acquisition tools, paired with carefully curated text containing category names and multiple pathological descriptions. This dataset covers 26 organs and 31 cancer types, incorporates multiple tissues from 14 heterogeneous patient cohorts, and includes over 5 million tissue patches extracted from more than 41K whole-slide images (WSIs), with all patches evaluated at varying magnifications.

提供机构：

Mohamed Bin Zayed University of Artificial Intelligence

创建时间：

2025-03-17

搜集汇总

数据集介绍

构建方式

Histo-VL数据集的构建基于多源数据整合与精细标注。该数据集涵盖了来自14个不同国家的患者队列，包含26种器官和31种癌症类型，总计超过41,000张全切片图像（WSIs），并从中提取了超过500万个图像块。数据采集过程中，使用了多达11种不同的成像设备，确保了数据的多样性和广泛性。每个图像块均配备了精心设计的文本描述，这些描述通过结合类别名称和多样化的病理描述生成，进一步增强了数据集的语义丰富性。

特点

Histo-VL数据集的特点在于其广泛的覆盖范围和多样化的临床任务。数据集不仅涵盖了多种癌症类型和器官，还包含了从不同放大倍数（4X至400X）下获取的图像块，能够模拟真实临床场景中的多种任务，如癌症检测、分级、亚型分类等。此外，数据集的文本描述通过单一句式和组合句式两种方式生成，进一步提升了模型的文本理解能力。Histo-VL的开放性和多样性使其成为评估病理学视觉-语言模型的理想基准。

使用方法

Histo-VL数据集的使用方法主要围绕其多模态特性展开。研究人员可以通过该数据集评估视觉-语言模型在多种临床任务中的表现，如癌症检测、分级、亚型分类等。数据集提供了详细的图像块和对应的文本描述，支持模型在图像和文本之间的联合学习。此外，数据集还支持对抗性攻击测试、放大倍数影响分析以及染色归一化实验，帮助研究人员全面评估模型的鲁棒性和泛化能力。通过Histo-VL，研究人员能够更好地理解模型在真实临床环境中的表现，并推动病理学视觉-语言模型的进一步发展。

背景与挑战

背景概述

Histo-VL数据集是由Mohamed Bin Zayed人工智能大学、哈利法大学和Shaukat Khanum癌症医院的研究团队于2025年推出的一个开源基准测试数据集，旨在解决病理学视觉-语言基础模型（VLMs）在多样化临床任务中的评估问题。该数据集涵盖了26种器官、31种癌症类型，并包含来自14个不同患者群体的超过500万个病理图像块，这些图像块来源于41,508张全切片图像（WSIs）。Histo-VL的推出填补了现有病理学基准测试在任务多样性、器官覆盖和图像获取工具多样性方面的空白，为病理学VLMs的全面评估提供了统一平台。该数据集不仅推动了病理学领域的研究，还为临床实践中的癌症检测、分型和分级等任务提供了重要支持。

当前挑战

Histo-VL数据集在构建和应用过程中面临多重挑战。首先，病理学VLMs在多样化临床任务中的表现存在显著波动，尤其是在文本描述变化时，模型的平衡准确率可能下降高达25%。其次，数据集的构建需要克服患者数据隐私保护的限制，同时确保数据的多样性和代表性。此外，病理学VLMs在面对对抗性攻击时表现出较低的鲁棒性，尤其是在图像和文本模态的扰动下，模型的准确率显著下降。最后，模型在校准方面存在不足，表现为高估计校准误差（ECE）和低预测置信度，这影响了其在临床环境中的可靠性。这些挑战凸显了病理学VLMs在真实临床场景中的应用仍需进一步优化。

常用场景

经典使用场景

Histo-VL数据集在病理学视觉-语言模型（VLMs）的评估中具有广泛的应用场景。该数据集通过结合来自26个器官、31种癌症类型的病理图像和对应的文本描述，提供了一个多模态的评估平台。其经典使用场景包括癌症检测、分级、亚型分类、组织表型分析、转移检测、肿瘤浸润淋巴细胞（TIL）检测以及微卫星不稳定性（MSI）检测等临床任务。这些任务模拟了病理学家在实际临床工作中面临的复杂挑战，使得模型能够在多样化的临床环境中进行系统性评估。

衍生相关工作

Histo-VL数据集的推出催生了一系列相关研究工作。例如，基于该数据集的研究揭示了现有视觉-语言模型在文本变化和对抗攻击下的脆弱性，促使研究人员开发更鲁棒的文本编码器和对抗训练方法。此外，Histo-VL还为模型校准和不确定性评估提供了新的研究方向，推动了病理学AI模型在临床中的可靠性和可解释性提升。这些衍生工作进一步扩展了Histo-VL在病理学AI领域的影响力。

数据集最近研究