RxWhyQA

Name: RxWhyQA
Creator: 梅奥诊所
Published: 2023-02-10 11:10:34
License: 暂无描述

arXiv2023-02-10 更新2024-06-21 收录

下载链接：

https://portal.dbmi.hms.harvard.edu/projects/n2c2-du/

下载链接

链接失效反馈

官方服务：

资源简介：

RxWhyQA数据集由梅奥诊所创建，包含96,939条QA记录，旨在解决临床环境中复杂的问答需求。数据集通过转换2018年n2c2挑战的注释生成，特别关注药物与原因之间的多对多关系，以模拟更真实的临床问答场景。该数据集适用于训练和评估能够处理多答案和多焦点问题的临床问答系统，特别强调了多答案问答的挑战性。

The RxWhyQA dataset, created by Mayo Clinic, contains 96,939 QA records, and is intended to address the complex question answering demands in clinical settings. Generated by converting annotations from the 2018 n2c2 Challenge, it specifically focuses on the many-to-many relationships between medications and their indications, in order to simulate more realistic clinical question answering scenarios. This dataset is suitable for training and evaluating clinical question answering systems that can handle multi-answer and multi-focal questions, and particularly emphasizes the challenges associated with multi-answer question answering.

提供机构：

梅奥诊所

创建时间：

2022-01-07

搜集汇总

数据集介绍

构建方式

在临床自然语言处理领域，构建能够反映真实医疗场景的抽取式问答数据集至关重要。RxWhyQA数据集的构建巧妙地利用了2018年国家NLP临床挑战赛（n2c2）语料库中已标注的药物-原因关系。研究团队将原始语料中的一对一、一对多、多对一以及多对多药物-原因关系，系统地转化为问答对。具体而言，对于单一药物对应单一原因的关系，直接生成标准的一问一答条目；对于存在多个原因或涉及多种药物的复杂关系，则保留其多元结构，形成需要识别多个答案或多个焦点的问答条目。此外，数据集中还包含了无法回答的问题条目，以模拟实际临床文档中信息缺失的情况。最终，通过这种基于关系转换的方法，生成了包含96,939个问答条目的丰富数据集，并格式化为与SQuAD 2.0兼容的JSON文件。

使用方法

RxWhyQA数据集旨在推动能够处理复杂临床问答的人工智能系统的研发与评估。使用者可以按照标准流程，将数据集划分为训练集、开发集和测试集，用于微调预训练语言模型，如临床领域专用的ClinicalBERT。数据集的SQuAD 2.0兼容格式确保了其能够无缝集成到现有的抽取式问答模型训练框架中。在评估阶段，研究者需要特别关注模型在处理多答案和多焦点问题上的性能，因为这是该数据集引入的核心挑战。论文中提供的基线解决方案采用了一种增量掩码的启发式方法，迫使单答案模型迭代寻找多个答案，这为后续研究提供了一个可比较的基准。通过在该数据集上进行训练和测试，可以有效地衡量模型在真实、复杂的临床信息提取场景下的鲁棒性和泛化能力。

背景与挑战

背景概述

在临床自然语言处理领域，提取式问答技术旨在从医疗文本中精准定位答案，以支持患者特异性查询。RxWhyQA数据集由梅奥诊所的研究团队于近年创建，其核心研究问题聚焦于解决临床EQA中多答案与多焦点问题的缺失。该数据集基于2018年n2c2挑战赛的标注语料，通过重构药物-原因关系，生成了包含96,939个问答对的大规模资源。它不仅推动了临床问答系统向更自然、复杂的场景演进，还为人工智能模型处理真实世界医疗推理提供了关键训练基础，显著提升了领域内对多答案提取任务的研究深度。

当前挑战

RxWhyQA数据集致力于应对临床提取式问答中多答案与多焦点问题的核心挑战。在领域问题层面，传统EQA系统常局限于单一答案提取，而真实临床场景中，单一问题可能对应多个分散答案或多个药物焦点，这要求模型具备更强的上下文推理与答案聚合能力。构建过程中，研究团队需从复杂的药物-原因关系注释中转换生成问答对，同时保持多答案结构的完整性，并处理文本中答案术语的重复出现与长距离依赖问题。此外，数据集的构建还需确保与现有SQuAD格式兼容，以促进模型的无缝训练与评估。

常用场景

经典使用场景

在临床自然语言处理领域，RxWhyQA数据集为提取式问答系统的开发与评估提供了关键资源。该数据集通过转换2018年n2c2挑战赛中的药物-原因关系注释，构建了包含多答案与多焦点问题的真实临床场景。其经典使用场景集中于训练模型从电子健康记录中精准定位处方理由，例如回答“为何给患者开具吗啡？”此类问题，从而模拟临床决策中的推理过程。数据集涵盖9.6万余条问答条目，其中25%的问题需要识别多个答案，2%的问题涉及单一问题中的多种药物，这为模型处理复杂临床文本提供了结构化测试平台。

解决学术问题

RxWhyQA数据集主要解决了临床提取式问答研究中多答案与多焦点问题缺失的学术瓶颈。传统数据集常将任务简化为“每文档单一答案”，忽略了临床文本中自然存在的多重合格答案或复合焦点问题，限制了AI系统在真实场景中的应用。该数据集通过引入多答案与多焦点构造，推动了模型从简单实体识别向复杂关系推理的演进，例如要求系统同时提取“呼吸困难”和“喘息”作为沙丁胺醇的多个处方原因。其意义在于填补了临床EQA数据集的空白，促进了模型在长距离推理、答案去重及上下文理解方面的研究，为开发更智能的医疗问答系统奠定了数据基础。

实际应用

RxWhyQA数据集的实际应用场景广泛涉及临床决策支持与电子健康记录智能化处理。在医疗实践中，该系统可辅助医生快速从海量临床笔记中提取患者特定的处方理由，提升诊疗效率与准确性。例如，在药物不良反应监测中，模型能自动识别“华法林”处方与“心房颤动”之间的关联，帮助临床药师评估用药合理性。此外，数据集支持开发面向患者的问答工具，使患者能够理解自身治疗方案背后的医学依据。这些应用不仅优化了临床工作流程，还为个性化医疗与远程健康管理提供了技术支撑。

数据集最近研究