CheXbench
收藏arXiv2025-09-30 收录
下载链接:
https://github.com/bowang-lab/MedRAX
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个广泛使用的基准,用于评估七个与临床相关的胸部X光片(CXR)解读任务,主要关注视觉问答(QA)和细粒度的图像文本推理。它特别侧重于与临床工作流程相关的视觉问题解答和细粒度推理。该数据集规模包括总共618个问题,其中238个来自Rad-Restruct数据集,380个来自OpenI数据集,任务集中在胸部X光片的解读任务上。
This dataset is a widely used benchmark for evaluating seven clinically relevant chest X-ray (CXR) interpretation tasks, with a primary focus on visual question answering (QA) and fine-grained image-text reasoning. It specifically centers on visual question answering and fine-grained reasoning tied to clinical workflows. The dataset comprises a total of 618 questions, 238 of which are sourced from the Rad-Restruct dataset and 380 from the OpenI dataset, with all tasks focused on chest X-ray interpretation.
提供机构:
Authors of the paper
搜集汇总
数据集介绍

背景与挑战
背景概述
CheXbench是一个医疗推理代理框架,专门用于胸部X光(CXR)的分析。它整合了多种先进的CXR分析工具和多模态大型语言模型,支持复杂的医疗查询处理,并提供了一个包含2500个查询的评估框架ChestAgentBench。
以上内容由遇见数据集搜集并总结生成



