医疗对话基准数据集DxBench

Name: 医疗对话基准数据集DxBench
Creator: 中山大学
License: 暂无描述

国家基础学科公共科学数据中心2026-03-21 收录

下载链接：

https://nbsdc.cn/general/dataDetail?id=69b97aa0195d2623ac6414ce&type=1

下载链接

链接失效反馈

官方服务：

资源简介：

DxBench医疗对话基准数据集主要面向真实场景自动诊断评估研究、医疗智能问诊系统开发需求建设，基于MedDialog数据集3121例真实医患对话经GPT-4自动提取与人工复核产生。该数据集源于科技创新2030-"新一代人工智能"重大项目"因果推理与决策理论模型研究"（2021ZD0111600）的指标2.2测试需求，旨在为开放域医疗对话诊断提供高质量、可复现的评测基准，解决现有医疗AI系统缺乏真实场景验证的关键问题。数据集经GPT-4自动抽取病例信息后人工复核，保留1148例高质量案例，覆盖15个临床科室、461种疾病、5038种症状。每例样本包含患者主诉（explicit symptoms）、医生追问所得症状（implicit symptoms）及最终确诊疾病（ground-truth disease）三元组，并给出3个候选疾病用于开放域评测。

提供机构：

中山大学