ChestAgentBench
收藏MedRAX: 医学推理胸部X光智能体
摘要
MedRAX是一个集成了最先进的胸部X光分析工具和多模态大型语言模型的统一框架的通用AI智能体,能够动态地利用这些模型处理复杂的医学查询,而无需额外的训练。为了严格评估其能力,我们引入了ChestAgentBench,一个包含7个不同类别下2500个复杂医学查询的全面基准。
MedRAX
-
核心技术:
- 核心架构:基于LangChain和LangGraph框架
- 语言模型:使用具有视觉能力的GPT-4o作为基础LLM
- 部署:支持本地和云部署
- 界面:使用Gradio构建的生产就绪界面
- 模块化设计:工具无关的架构,允许轻松集成新的功能
-
集成工具:
- 视觉问答:使用CheXagent和LLaVA-Med进行复杂的视觉理解和医学推理
- 分割:使用MedSAM和PSPNet模型,基于ChestX-Det训练,用于精确识别解剖结构
- 定位:使用Maira-2定位医学图像中的特定发现
- 报告生成:使用基于CheXpert Plus训练的SwinV2 Transformer生成详细的医学报告
- 疾病分类:利用TorchXRayVision的DenseNet-121检测18种病理类别
- X光生成:使用RoentGen进行合成胸部X光图像生成
- 实用工具:包括DICOM处理、可视化工具和自定义绘图功能
注意,当前版本的MedRAX是实验性发布的,并且不支持GPT-4o和MedSAM的视觉功能。我们很快将集成这些功能。
ChestAgentBench
ChestAgentBench是一个包含7个类别下2500个复杂医学查询的全面评估框架,基于675个专家策划的临床案例构建。该基准通过以下类别评估胸部X光解释中的复杂多步骤推理:
- 检测
- 分类
- 定位
- 比较
- 关系
- 诊断
- 特征描述
安装
-
先决条件:Python 3.8+,CUDA/GPU(最佳性能)
-
安装步骤: bash git clone https://github.com/bowang-lab/MedRAX.git cd MedRAX pip install -e .
-
快速开始: bash python main.py
作者
- Adibvafa Fallahpour (adibvafa.fallahpour@mail.utoronto.ca)
- Jun Ma
- Alif Munim
- Hongwei Lyu
- Bo Wang
引用
@misc{fallahpour2025medraxmedicalreasoningagent, title={MedRAX: Medical Reasoning Agent for Chest X-ray}, author={Adibvafa Fallahpour and Jun Ma and Alif Munim and Hongwei Lyu and Bo Wang}, year={2025}, eprint={2502.02673}, archivePrefix={arXiv}, primaryClass={cs.LG}, url={https://arxiv.org/abs/2502.02673}, }




