RJUA-QA

Name: RJUA-QA
Creator: 上海交通大学医学院附属仁济医院泌尿科
Published: 2024-01-07 16:58:02
License: 暂无描述

arXiv2024-01-07 更新2024-06-21 收录

下载链接：

https://github.com/alipay/RJU_Ant_QA

下载链接

链接失效反馈

官方服务：

资源简介：

RJUA-QA是一个专为泌尿科问题解答和临床推理设计的新型医学数据集，由上海交通大学医学院附属仁济医院泌尿科与蚂蚁集团合作创建。该数据集包含2,132个精心策划的Question-Context-Answer三元组，涵盖67种常见的泌尿系统疾病，覆盖了97.6%寻求泌尿科医疗服务的患者群体。数据集通过模拟真实临床场景，结合专家知识和经验，旨在帮助大型语言模型生成可靠的诊断和医疗建议。RJUA-QA不仅是首个针对临床医学推理的中文QA数据集，还为评估和提升大型语言模型在医疗领域的应用提供了基准。

RJUA-QA is a novel medical dataset specifically designed for urological question answering and clinical reasoning, co-developed by the Department of Urology, Renji Hospital, School of Medicine, Shanghai Jiao Tong University and Ant Group. This dataset comprises 2,132 carefully curated Question-Context-Answer triplets, covering 67 common urinary system diseases that account for 97.6% of the patient population seeking urological medical services. By simulating real clinical scenarios and integrating expert knowledge and experience, it aims to assist large language models (LLMs) in generating reliable diagnoses and medical advice. RJUA-QA is not only the first Chinese QA dataset focused on clinical medical reasoning, but also provides a benchmark for evaluating and advancing the application of large language models in the medical domain.

提供机构：

上海交通大学医学院附属仁济医院泌尿科

创建时间：

2023-12-15

搜集汇总

数据集介绍

构建方式

在泌尿外科临床实践与人工智能技术融合的背景下，RJUA-QA数据集的构建体现了严谨的医学数据工程理念。其核心流程始于从真实临床场景中提取虚拟患者信息，涵盖门诊、急诊及住院手术等多类医疗情境。通过大型语言模型生成初步的问答对，并融合来自《中国泌尿外科疾病诊断治疗指南》、权威教科书及PubMed文献的专业知识作为参考语境。随后，由具备十年以上临床经验的泌尿外科专家团队进行三重校准，确保术语精准、逻辑严密及诊断可靠，最终形成结构化的问答数据格式。

特点

该数据集展现出鲜明的临床实用性与学术深度。其问题设计源于真实患者咨询模式，覆盖泌尿外科67种常见疾病类别，疾病覆盖率达就诊人群的97.6%，具有高度的临床代表性。数据实例包含患者问题、专业参考语境、医生回答、确诊疾病及临床建议五部分，尤其注重对多病共存复杂情境的模拟，约30%案例涉及两种及以上泌尿科诊断，从而要求模型具备鉴别原发与继发病症的逻辑推理能力。

使用方法

作为首个专注于临床推理的中文医疗问答数据集，RJUA-QA为大型语言模型的医学能力评估与优化提供了标准基准。研究者可利用其2132组高质量问答对，对模型进行诊断准确性、建议合理性及整体响应质量的系统测评。数据集内嵌的权威医学语境为模型提供了可追溯的推理依据，支持其在生成诊断结论时进行知识检索与逻辑验证。该资源亦适用于医疗对话系统的微调训练，推动人工智能在严肃医疗场景中的可靠应用。

背景与挑战

背景概述

在人工智能与医疗健康深度融合的时代背景下，大型语言模型（LLMs）在临床辅助诊断中的应用潜力日益凸显。然而，通用LLMs在处理需要专业医学知识与复杂推理的患者咨询时，常因领域知识匮乏与逻辑推理能力不足而面临挑战。为弥合这一鸿沟，蚂蚁集团与上海交通大学医学院附属仁济医院泌尿科于2024年联合发布了RJUA-QA数据集。该数据集聚焦于泌尿外科领域，旨在通过模拟真实临床场景中的患者问询，构建一个要求模型结合专业证据进行诊断推理的高质量问答基准。其核心研究问题在于提升LLMs在专业医疗场景下的可靠诊断与检查建议生成能力，覆盖了超过97.6%的泌尿科就诊人群所患疾病，对推动医疗专用人工智能的发展具有重要的奠基性影响。

当前挑战

RJUA-QA数据集致力于解决医疗问答与临床推理这一核心领域问题，其首要挑战在于要求模型精准理解患者描述的非结构化症状，并依据权威医学知识库进行复杂逻辑推断，以生成准确的诊断结论与检查建议。这要求模型不仅需具备深厚的泌尿科专业知识，还需拥有类似临床专家的综合推理能力。在数据集构建过程中，研究团队面临多重挑战：一是如何从海量真实诊疗记录与临床经验中，合成既具真实性又涵盖广泛疾病谱系的虚拟患者数据；二是在数据标注环节，确保每对问答所附的参考上下文（如诊疗指南、文献）具有高度相关性与权威性，并需由专家团队进行多轮校准以保证诊断逻辑的严谨性；三是为增强任务难度，需在上下文中合理引入干扰信息，以模拟真实诊断中信息甄别的复杂性。

常用场景

经典使用场景

在泌尿外科临床决策支持系统中，RJUA-QA数据集常被用于评估和优化大型语言模型的医学推理能力。该数据集模拟真实患者咨询场景，涵盖67种常见泌尿系统疾病，通过问题-上下文-答案三元组结构，要求模型结合专业医学知识进行诊断推理。研究者利用该数据集对模型进行微调或基准测试，以提升其在复杂临床语境下的诊断准确性和建议可靠性，从而推动智能医疗助手在专科领域的应用发展。

衍生相关工作

围绕RJUA-QA数据集，已衍生出多项聚焦于医学大语言模型优化与评估的经典工作。例如，研究团队利用该数据对HuatuoGPT、ChatGLM等模型进行性能对比，探索知识增强与推理机制改进的路径。后续工作进一步扩展了多轮对话建模、罕见病覆盖以及情感交互等维度，推动了如多轮临床问答数据集、专科知识图谱构建等研究方向，持续丰富泌尿专科人工智能生态体系。

数据集最近研究