SlideBench

Hugging Face2024-11-07 更新2024-12-12 收录

下载链接：

https://huggingface.co/datasets/General-Medical-AI/SlideBench

下载链接

链接失效反馈

官方服务：

资源简介：

SlideBench-VQA(BCNB)数据集是SlideChat项目的一部分，用于评估SlideChat在理解全片病理图像方面的性能。该数据集基于Early Breast Cancer Core-Needle Biopsy (BCNB)数据集，通过将分类目标重新表述为问题并将多类标签转换为可选选项，形成了7,247个VQA对。数据集提供了详细的测试信息，包括患者ID、任务、问题、答案选项和正确答案，并提供了使用预训练模型CONCH提取的特征。

SlideBench-VQA (BCNB) is a component of the SlideChat project, designed to evaluate SlideChat’s performance in comprehending whole-slide pathological images. Built upon the Early Breast Cancer Core-Needle Biopsy (BCNB) dataset, this dataset generates 7,247 VQA pairs by reformulating classification targets into natural language questions and converting multi-class labels into selectable answer options. It provides comprehensive test metadata including patient IDs, tasks, questions, answer options, and correct answers, alongside features extracted using the pre-trained model CONCH.

创建时间：

2024-11-07

原始信息汇总

SlideBench 数据集概述

简介

SlideBench 是一个综合基准，用于评估 SlideChat 在理解全片病理图像方面的性能。SlideBench 包含三个主要组件：

SlideBench-Caption: 包含来自 TCGA 数据集的 734 张全片图像（WSIs），用于评估 SlideChat 生成准确和连贯描述的能力。
SlideBench-VQA(TCGA): 设计用于闭集视觉问答，评估 SlideChat 在多个方面的性能。经过大型语言模型（LLMs）和专家病理学家的精心筛选，SlideBench-VQA (TCGA) 包含 7,827 个 VQA 对，涵盖 13 个类别。
SlideBench-VQA(BCNB): 为进一步评估泛化能力，引入了早期乳腺癌核心针活检（BCNB）数据集，该数据集具有多样化的患者群体和一系列临床任务标签。通过将分类目标重新表述为问题，并将多类标签转换为可选选项，BCNB 数据集被格式化为 VQA 对，创建了 7,247 个 VQA 对。

数据详情

SlideBench-VQA (BCNB).csv: 提供详细的测试信息，包括 patient_id、task、question、answer options（A, B, C, D）和 correct answer。
BCNB_patch_feat.tar.gz: 使用预训练的 CONCH 模型提取了 1,058 张 WSIs 的特征。每个文件包含 512 维的特征表示，以及相应的空间位置信息。文件按患者 ID 命名，例如 "1.csv" 对应患者 ID 1。

引用

如果该数据集对你的研究有用，请考虑引用以下文献：

bibtex @article{chen2024slidechat, title={SlideChat: A Large Vision-Language Assistant for Whole-Slide Pathology Image Understanding}, author={Chen, Ying and Wang, Guoan and Ji, Yuanfeng and Li, Yanjun and Ye, Jin and Li, Tianbin and Zhang, Bin and Pei, Nana and Yu, Rongshan and Qiao, Yu and others}, journal={arXiv preprint arXiv:2410.11761}, year={2024} }

搜集汇总

数据集介绍

构建方式

SlideBench数据集的构建基于对全切片图像（WSIs）的深入理解需求，旨在系统评估SlideChat模型的性能。该数据集包含三个主要部分：SlideBench-Caption、SlideBench-VQA（TCGA）和SlideBench-VQA（BCNB）。SlideBench-Caption部分包含734张来自TCGA数据集的WSIs，用于评估模型生成图像描述的能力。SlideBench-VQA（TCGA）部分通过大语言模型和病理学专家的筛选，生成了7,827个视觉问答对，涵盖13个类别。SlideBench-VQA（BCNB）部分则通过将乳腺癌核心针活检（BCNB）数据集的分类目标转化为问答形式，生成了7,247个视觉问答对，进一步评估模型的泛化能力。

特点

SlideBench数据集的特点在于其全面性和多样性。它不仅涵盖了大量的WSIs，还通过视觉问答对的形式，深入评估模型在多种临床任务中的表现。SlideBench-VQA（BCNB）部分特别引入了乳腺癌核心针活检数据集，增加了数据集的临床多样性和复杂性。此外，数据集还提供了从WSIs中提取的512维特征表示，这些特征通过预训练的CONCH模型生成，为研究者提供了丰富的分析材料。

使用方法

SlideBench数据集的使用方法主要围绕视觉问答任务的评估展开。研究者可以通过提供的CSV文件获取详细的测试信息，包括患者ID、任务、问题、答案选项和正确答案。此外，数据集还提供了从WSIs中提取的特征文件，这些文件以患者ID命名，包含512维的特征表示和对应的空间位置信息。研究者可以利用这些特征进行进一步的模型训练和评估。通过结合原始数据集和预处理步骤的详细信息，SlideBench为病理图像理解领域的研究提供了强有力的支持。

背景与挑战

背景概述

SlideBench数据集由研究团队于2024年推出，旨在系统评估SlideChat这一开源视觉语言助手在理解千兆像素级全切片图像（WSI）方面的性能。该数据集由三个主要组件构成：SlideBench-Caption、SlideBench-VQA（TCGA）和SlideBench-VQA（BCNB）。SlideBench-Caption包含来自TCGA数据集的734张WSI，用于评估SlideChat生成准确且连贯的WSI描述的能力。SlideBench-VQA（TCGA）则专注于封闭式视觉问答，包含7,827个VQA对，涵盖13个类别，经过大型语言模型和病理学专家的严格筛选。SlideBench-VQA（BCNB）则基于早期乳腺癌核心针活检（BCNB）数据集，通过将分类目标转化为问题，生成了7,247个VQA对，进一步评估模型的泛化能力。该数据集的发布为病理学图像理解领域提供了重要的基准工具，推动了相关研究的进展。

当前挑战

SlideBench数据集在构建和应用过程中面临多重挑战。首先，病理学图像的复杂性和高分辨率使得模型在处理和理解这些图像时面临巨大的计算和存储压力。其次，生成高质量的视觉问答对需要结合大型语言模型和病理学专家的专业知识，确保问题的准确性和多样性，这一过程耗时且资源密集。此外，BCNB数据集的多样性要求模型具备强大的泛化能力，以应对不同患者群体和临床任务的复杂性。最后，数据预处理和特征提取的步骤需要高效且精确的算法支持，以确保后续模型训练的稳定性和效果。这些挑战不仅考验了数据集的构建质量，也对后续模型的开发和优化提出了更高的要求。

常用场景

经典使用场景

SlideBench数据集在医学影像分析领域具有重要应用，特别是在全切片图像（WSI）的理解与描述方面。通过SlideBench-Caption、SlideBench-VQA (TCGA)和SlideBench-VQA (BCNB)三个子集，研究者能够系统地评估视觉语言模型在生成准确描述和回答复杂视觉问题方面的能力。这一数据集为医学影像的自动化分析提供了强有力的工具，推动了病理学与人工智能的深度融合。

衍生相关工作

SlideBench数据集的发布催生了一系列相关研究工作。基于该数据集，研究者开发了SlideChat，首个能够理解千兆像素全切片图像的开源视觉语言助手。此外，SlideBench还为医学影像领域的多模态学习、视觉问答和图像描述生成等任务提供了基准测试平台，推动了相关算法的优化与创新。这些工作不仅扩展了SlideBench的应用范围，也为医学影像分析领域的研究提供了新的方向。

数据集最近研究