医疗对话基准数据集DxBench
收藏国家基础学科公共科学数据中心2026-03-21 收录
下载链接:
https://nbsdc.cn/general/dataDetail?id=69b97aa0195d2623ac6414ce&type=1
下载链接
链接失效反馈官方服务:
资源简介:
DxBench医疗对话基准数据集主要面向真实场景自动诊断评估研究、医疗智能问诊系统开发需求建设,基于MedDialog数据集3121例真实医患对话经GPT-4自动提取与人工复核产生。该数据集源于科技创新2030-"新一代人工智能"重大项目"因果推理与决策理论模型研究"(2021ZD0111600)的指标2.2测试需求,旨在为开放域医疗对话诊断提供高质量、可复现的评测基准,解决现有医疗AI系统缺乏真实场景验证的关键问题。数据集经GPT-4自动抽取病例信息后人工复核,保留1148例高质量案例,覆盖15个临床科室、461种疾病、5038种症状。每例样本包含患者主诉(explicit symptoms)、医生追问所得症状(implicit symptoms)及最终确诊疾病(ground-truth disease)三元组,并给出3个候选疾病用于开放域评测。
提供机构:
中山大学



