DDxPlus, iCraft-MD, RareBench

Name: DDxPlus, iCraft-MD, RareBench
Creator: 加州大学圣塔芭芭拉分校，NEC欧洲实验室，圣基里尔和梅达尔大学
Published: 2025-02-26 22:31:43
License: 暂无描述

arXiv2025-02-26 更新2025-02-28 收录

下载链接：

http://arxiv.org/abs/2502.19175v1

下载链接

链接失效反馈

官方服务：

资源简介：

DDxPlus是一个包含130万合成呼吸系统患者案例的数据集，覆盖了49种与呼吸相关的疾病；iCraft-MD包含394种皮肤病，以互动的方式呈现；RareBench则扩展了DDxPlus，加入了421种罕见疾病。这三个数据集经过标准化处理，以支持交互式诊断评估的连贯性。

DDxPlus is a dataset comprising 1.3 million synthetic respiratory patient cases, spanning 49 respiratory-related diseases; iCraft-MD encompasses 394 skin disorders and is presented in an interactive manner; RareBench extends DDxPlus by incorporating 421 rare diseases. All three datasets have been standardized to ensure the coherence of interactive diagnostic assessments.

提供机构：

加州大学圣塔芭芭拉分校，NEC欧洲实验室，圣基里尔和梅达尔大学

创建时间：

2025-02-26

搜集汇总

数据集介绍

构建方式

该数据集由三个模块化组件构成：诊断驱动器（DDxDriver）、病史采集模拟器和两个专用代理（知识检索代理和诊断策略代理）。诊断驱动器作为中心协调器，负责管理患者信息、调度诊断行动、确保决策过程的可追溯性，并执行停止标准。病史采集模拟器模拟医生与患者的交互环境，允许在诊断过程中迭代地收集信息。知识检索代理从外部知识库中检索相关医学知识，以支持诊断过程。诊断策略代理负责生成、细化和排名可能的诊断，根据患者的当前信息进行预测。DDxAgent通过迭代学习机制不断优化诊断，以适应现实世界中诊断的复杂性和不确定性。

特点

DDxAgent框架的特点是模块化和可解释性。它通过迭代学习机制，允许诊断推理在交互过程中不断发展，而不是假设完整的患者信息是可用的。此外，DDxAgent的架构允许对不同的组件进行单独评估和优化，提高了诊断的准确性和泛化能力。最后，DDxAgent记录了所有中间推理、行动和观察结果，提供了对其诊断推理过程的透明洞察。

使用方法

DDxAgent的使用方法包括以下步骤：首先，通过病史采集模拟器与患者进行交互，以收集必要的信息。然后，知识检索代理从外部知识库中检索相关医学知识，以支持诊断过程。接着，诊断策略代理根据患者的当前信息生成、细化和排名可能的诊断。最后，诊断驱动器根据患者的最新信息和代理的反馈，调度下一步的诊断行动。通过迭代学习机制，DDxAgent能够不断优化诊断，提高诊断的准确性和泛化能力。

背景与挑战

背景概述

在临床决策过程中，鉴别诊断（DDx）是一项基础且复杂的任务，医生需要根据症状、既往病史和医学知识逐步缩小可能疾病的范围。随着大型语言模型（LLM）的快速发展，其在支持DDx方面展现出巨大潜力。然而，现有方法面临着关键限制，包括单一数据集评估、组件孤立优化、对完整患者资料的假设以及单次诊断等。为此，Rose等人（2025）提出了一个模块化可解释的DDx代理框架（MEDDxAgent），旨在通过迭代学习而非假设完整患者资料即可进行交互式DDx。该框架集成了三个模块化组件：1）协调器（DDxDriver），2）病史采集模拟器，以及3）两个专门用于知识检索和诊断策略的代理。为了确保稳健评估，研究人员引入了一个全面的DDx基准，涵盖了呼吸系统、皮肤和罕见疾病。研究表明，MEDDxAgent在交互式DDx中实现了超过10%的准确率提升，并提供对其诊断推理过程的解释。

当前挑战

MEDDxAgent在交互式DDx中面临的主要挑战包括：1）确保在初始患者资料不完整的情况下，能够逐步收集信息并迭代更新诊断结果；2）在迭代过程中，协调器（DDxDriver）需要根据实时观察动态调整组件调用顺序，以实现高效的诊断推理；3）知识检索代理需要在有限的信息下，准确地从外部数据库中检索到与患者症状相关的医疗知识；4）诊断策略代理需要根据收集到的信息，动态地生成、细化和排名可能的诊断结果。此外，该框架还需解决模型选择、语言覆盖范围、多模态数据融合以及基准数据集选择等方面的挑战，以提高其在现实世界中的适用性和有效性。

常用场景

经典使用场景

DDxPlus, iCraft-MD, and RareBench数据集是用于构建和评估自动诊断模型的关键资源。这些数据集涵盖了呼吸、皮肤和罕见疾病，为研究者提供了广泛而深入的案例库。在MEDDxAgent框架中，这些数据集被用来训练和测试知识检索和诊断策略两个专门的诊断代理。知识检索代理通过从外部数据库中检索相关信息来增强诊断推理过程，而诊断策略代理则负责根据获取的信息生成、细化和排名可能的诊断结果。DDxDriver作为协调者，确保这些代理之间的迭代学习和交互式优化，从而提高诊断的准确性和可解释性。

实际应用

DDxPlus, iCraft-MD, and RareBench数据集在实际应用中具有广泛的前景。它们可以用于开发能够与患者进行交互并逐步收集信息的诊断系统，从而提高诊断的准确性和患者的满意度。此外，这些数据集可以用于构建能够处理罕见和复杂病例的模型，这些病例通常难以诊断。最终，这些数据集可以用于开发能够解释其诊断推理过程的模型，从而增强医生和患者之间的信任。

衍生相关工作

DDxPlus, iCraft-MD, and RareBench数据集已经衍生出一些相关的经典工作。例如，KG4Diagnosis框架整合了语言模型和知识图谱，用于医学诊断。StreamBench是一个用于评估语言代理在流环境中连续改进的框架。AMIE、AMSC、AgentHospital、MediQ和MedAgents等框架分别解决了临床交互的不同方面。这些工作共同推动了自动诊断领域的发展，并促进了更高效和准确的诊断系统的开发。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集