five

MeDiaQA|医疗问答数据集|多轮对话数据集

收藏
arXiv2021-08-18 更新2024-08-06 收录
医疗问答
多轮对话
下载链接:
http://arxiv.org/abs/2108.08074v1
下载链接
链接失效反馈
资源简介:
MeDiaQA是一个针对医疗对话的问答数据集,由泰康保险集团科学技术研究院创建。该数据集包含22,000个多选题,覆盖150种疾病专业,数据来源于中国主流在线医疗咨询网站haodf.com和dxy.com。数据集的创建过程包括对话爬取、数据处理和问题编写三个步骤。MeDiaQA旨在通过模拟真实的医疗对话场景,测试模型在多轮对话中的计算、推理和理解能力,特别强调对医疗知识和数学计算的应用,以解决现有数据集在处理复杂医疗问答任务中的不足。
提供机构:
泰康保险集团科学技术研究院
创建时间:
2021-08-18
AI搜集汇总
数据集介绍
main_image_url
构建方式
MeDiaQA数据集的构建过程分为三个主要步骤:对话爬取、数据处理以及问题-答案对的编写。首先,从中国主流在线医疗咨询网站haodf.com和dxy.com爬取了患者与医生之间的真实对话。随后,通过去除无关信息并保留对话内容,确保数据质量。最后,与数据标注团队合作,为每个对话编写两个问题-答案对,确保问题需要推理和医学背景知识。
特点
MeDiaQA数据集的特点在于其基于真实在线医疗对话,涵盖了150种疾病专科,包含22,000个多选题和11,524个对话。该数据集不仅要求模型理解医学知识,还需在多轮对话中追踪不同角色的信息,并进行数学计算。这种设计使得MeDiaQA在测试模型的计算、推理和理解能力方面具有独特挑战性。
使用方法
MeDiaQA数据集的使用方法主要围绕其问答任务展开。数据集由三元组(对话、问题、答案)构成,模型需在训练阶段学习如何从对话中提取信息并回答问题。测试阶段,模型需根据给定的对话和问题预测答案。通过这种方式,MeDiaQA能够有效评估模型在医疗对话理解和数学计算方面的能力。
背景与挑战
背景概述
MeDiaQA数据集由泰康保险集团科技研究院的Huqun Suri等人于2021年提出,旨在解决医学对话中的问答问题。该数据集基于真实在线医疗对话,包含22,000个多项选择题,涵盖了11,000多个对话和120,000条医患对话,涉及150种疾病专科。数据来源于中国主流在线医疗咨询网站haodf.com和dxy.com。MeDiaQA是首个专注于医学对话推理的问答数据集,尤其强调对定量内容的理解。该数据集的构建不仅推动了医学领域问答系统的发展,还为模型在多轮对话中的计算、推理和理解能力提供了新的测试平台。
当前挑战
MeDiaQA数据集在解决医学对话问答问题时面临多重挑战。首先,医学领域的问答问题通常需要结合外部专业知识,模型不仅需要理解对话内容,还需具备医学背景知识。其次,对话涉及多个角色,模型需跟踪并判断不同角色提供的信息。此外,许多问题要求模型进行数学计算,如药物剂量的转换或时间周期的计算,这对模型的推理能力提出了更高要求。在数据构建过程中,如何从大量对话中提取有效信息并设计具有挑战性的问题也是一大难题。尽管MeDiaBERT模型在实验中取得了64.3%的准确率,但与人类93%的准确率相比,仍有较大提升空间。
常用场景
经典使用场景
MeDiaQA数据集主要用于评估和提升机器在医疗对话中的阅读理解能力。该数据集通过包含大量真实的医患对话,要求模型不仅能够理解对话内容,还需进行数学计算和逻辑推理,从而回答复杂的医学问题。这种设置使得MeDiaQA成为测试和开发先进问答系统的理想平台。
解决学术问题
MeDiaQA解决了医疗领域问答系统中存在的几个关键问题。首先,它填补了现有数据集在医疗对话理解方面的空白,特别是涉及多轮对话和定量内容的理解。其次,该数据集通过引入需要外部医学知识和数学计算的问题,推动了模型在复杂推理和计算能力上的进步。最后,MeDiaQA为研究者提供了一个标准化的测试平台,以评估和比较不同问答系统的性能。
衍生相关工作
MeDiaQA的推出激发了多项相关研究,特别是在医疗问答系统和自然语言处理领域。例如,基于MeDiaQA的研究工作已经开发出新的算法和模型,如MeDia-BERT,这些模型在理解和处理复杂的医疗对话方面显示出显著的性能提升。此外,该数据集还促进了跨学科合作,结合医学知识和人工智能技术,推动了医疗信息处理技术的发展。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

LEGO数据集

该数据集包含了关于LEGO公司的历史、产品提供以及特定LEGO套装的信息,用于分析LEGO套装的规模、发布年份、主题分布以及套装复杂性的变化。

github 收录

FER2013

FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。

github 收录

RAVDESS

情感语音和歌曲 (RAVDESS) 的Ryerson视听数据库包含7,356个文件 (总大小: 24.8 GB)。该数据库包含24位专业演员 (12位女性,12位男性),以中性的北美口音发声两个词汇匹配的陈述。言语包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶的表情,歌曲则包含平静、快乐、悲伤、愤怒和恐惧的情绪。每个表达都是在两个情绪强度水平 (正常,强烈) 下产生的,另外还有一个中性表达。所有条件都有三种模态格式: 纯音频 (16位,48kHz .wav),音频-视频 (720p H.264,AAC 48kHz,.mp4) 和仅视频 (无声音)。注意,Actor_18没有歌曲文件。

OpenDataLab 收录

LinkedIn Salary Insights Dataset

LinkedIn Salary Insights Dataset 提供了全球范围内的薪资数据,包括不同职位、行业、地理位置和经验水平的薪资信息。该数据集旨在帮助用户了解薪资趋势和市场行情,支持职业规划和薪资谈判。

www.linkedin.com 收录

VisDrone2019

VisDrone2019数据集由AISKYEYE团队在天津大学机器学习和数据挖掘实验室收集,包含288个视频片段共261,908帧和10,209张静态图像。数据集覆盖了中国14个不同城市的城市和乡村环境,包括行人、车辆、自行车等多种目标,以及稀疏和拥挤场景。数据集使用不同型号的无人机在各种天气和光照条件下收集,手动标注了超过260万个目标边界框,并提供了场景可见性、对象类别和遮挡等重要属性。

github 收录