MeDiaQA
收藏arXiv2021-08-18 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/2108.08074v1
下载链接
链接失效反馈官方服务:
资源简介:
MeDiaQA是一个针对医疗对话的问答数据集,由泰康保险集团科学技术研究院创建。该数据集包含22,000个多选题,覆盖150种疾病专业,数据来源于中国主流在线医疗咨询网站haodf.com和dxy.com。数据集的创建过程包括对话爬取、数据处理和问题编写三个步骤。MeDiaQA旨在通过模拟真实的医疗对话场景,测试模型在多轮对话中的计算、推理和理解能力,特别强调对医疗知识和数学计算的应用,以解决现有数据集在处理复杂医疗问答任务中的不足。
MeDiaQA is a question answering (QA) dataset for medical dialogues, created by the Institute of Science and Technology of Taikang Insurance Group. It contains 22,000 multiple-choice questions covering 150 medical specialties, with data sourced from two mainstream Chinese online medical consultation platforms: haodf.com and dxy.com. The dataset construction process includes three core steps: dialogue crawling, data preprocessing, and question formulation. MeDiaQA is designed to simulate real-world medical dialogue scenarios, aiming to evaluate a model's computational, reasoning, and comprehension abilities in multi-turn dialogues, with a special focus on the application of medical knowledge and mathematical calculations, so as to address the limitations of existing datasets in handling complex medical question answering tasks.
提供机构:
泰康保险集团科学技术研究院
创建时间:
2021-08-18
搜集汇总
数据集介绍

构建方式
MeDiaQA数据集的构建过程分为三个主要步骤:对话爬取、数据处理以及问题-答案对的编写。首先,从中国主流在线医疗咨询网站haodf.com和dxy.com爬取了患者与医生之间的真实对话。随后,通过去除无关信息并保留对话内容,确保数据质量。最后,与数据标注团队合作,为每个对话编写两个问题-答案对,确保问题需要推理和医学背景知识。
特点
MeDiaQA数据集的特点在于其基于真实在线医疗对话,涵盖了150种疾病专科,包含22,000个多选题和11,524个对话。该数据集不仅要求模型理解医学知识,还需在多轮对话中追踪不同角色的信息,并进行数学计算。这种设计使得MeDiaQA在测试模型的计算、推理和理解能力方面具有独特挑战性。
使用方法
MeDiaQA数据集的使用方法主要围绕其问答任务展开。数据集由三元组(对话、问题、答案)构成,模型需在训练阶段学习如何从对话中提取信息并回答问题。测试阶段,模型需根据给定的对话和问题预测答案。通过这种方式,MeDiaQA能够有效评估模型在医疗对话理解和数学计算方面的能力。
背景与挑战
背景概述
MeDiaQA数据集由泰康保险集团科技研究院的Huqun Suri等人于2021年提出,旨在解决医学对话中的问答问题。该数据集基于真实在线医疗对话,包含22,000个多项选择题,涵盖了11,000多个对话和120,000条医患对话,涉及150种疾病专科。数据来源于中国主流在线医疗咨询网站haodf.com和dxy.com。MeDiaQA是首个专注于医学对话推理的问答数据集,尤其强调对定量内容的理解。该数据集的构建不仅推动了医学领域问答系统的发展,还为模型在多轮对话中的计算、推理和理解能力提供了新的测试平台。
当前挑战
MeDiaQA数据集在解决医学对话问答问题时面临多重挑战。首先,医学领域的问答问题通常需要结合外部专业知识,模型不仅需要理解对话内容,还需具备医学背景知识。其次,对话涉及多个角色,模型需跟踪并判断不同角色提供的信息。此外,许多问题要求模型进行数学计算,如药物剂量的转换或时间周期的计算,这对模型的推理能力提出了更高要求。在数据构建过程中,如何从大量对话中提取有效信息并设计具有挑战性的问题也是一大难题。尽管MeDiaBERT模型在实验中取得了64.3%的准确率,但与人类93%的准确率相比,仍有较大提升空间。
常用场景
经典使用场景
MeDiaQA数据集主要用于评估和提升机器在医疗对话中的阅读理解能力。该数据集通过包含大量真实的医患对话,要求模型不仅能够理解对话内容,还需进行数学计算和逻辑推理,从而回答复杂的医学问题。这种设置使得MeDiaQA成为测试和开发先进问答系统的理想平台。
解决学术问题
MeDiaQA解决了医疗领域问答系统中存在的几个关键问题。首先,它填补了现有数据集在医疗对话理解方面的空白,特别是涉及多轮对话和定量内容的理解。其次,该数据集通过引入需要外部医学知识和数学计算的问题,推动了模型在复杂推理和计算能力上的进步。最后,MeDiaQA为研究者提供了一个标准化的测试平台,以评估和比较不同问答系统的性能。
衍生相关工作
MeDiaQA的推出激发了多项相关研究,特别是在医疗问答系统和自然语言处理领域。例如,基于MeDiaQA的研究工作已经开发出新的算法和模型,如MeDia-BERT,这些模型在理解和处理复杂的医疗对话方面显示出显著的性能提升。此外,该数据集还促进了跨学科合作,结合医学知识和人工智能技术,推动了医疗信息处理技术的发展。
以上内容由遇见数据集搜集并总结生成



