five

MedDec

收藏
arXiv2024-08-23 更新2024-08-27 收录
下载链接:
https://github.com/CLU-UML/MedDec
下载链接
链接失效反馈
官方服务:
资源简介:
MedDec数据集由马萨诸塞大学洛厄尔分校和麻省理工学院的专家团队创建,包含451份出院总结,涵盖11种疾病类型和10种医疗决策类别。数据集通过专家标注,旨在提取和分类临床笔记中的医疗决策,以改善临床实践和生物NLP技术。该数据集的创建过程严格遵循DICTUM分类法,通过三位专家的独立标注和仲裁确保数据质量。MedDec数据集的应用领域广泛,包括但不限于医疗决策支持系统、健康政策制定和临床决策分析。

The MedDec dataset was developed by a team of experts from the University of Massachusetts Lowell and the Massachusetts Institute of Technology. It contains 451 discharge summaries covering 11 disease types and 10 medical decision categories. Annotated by domain experts, this dataset aims to extract and classify medical decisions from clinical notes, so as to advance clinical practice and biomedical natural language processing (BioNLP) technologies. Its construction strictly follows the DICTUM taxonomy, and data quality is ensured via independent annotation and arbitration conducted by three experts. The MedDec dataset has a wide range of application scenarios, including but not limited to medical decision support systems, health policy formulation and clinical decision analysis.
提供机构:
计算机与信息科学学院,马萨诸塞大学洛厄尔分校;医学工程与科学研究所,麻省理工学院
创建时间:
2024-08-23
搜集汇总
数据集介绍
main_image_url
构建方式
MedDec数据集的构建方式是通过从MIMIC-III数据库中收集患者的出院摘要,并邀请领域专家根据DICTUM(医学决策识别和分类分类法)对出院摘要中的医疗决策进行标注。该数据集涵盖了11种不同的表型(疾病)和10种医疗决策类型,包括定义问题、药物、治疗程序、评估测试结果等。专家们对每个出院摘要中的所有医疗决策进行独立标注,并由第三位高级专家对标注结果进行裁决。
特点
MedDec数据集的特点包括:1)它是第一个针对从临床笔记中提取医疗决策的研究而构建的专家标注数据集;2)数据集涵盖了11种不同的表型(疾病),具有性别、种族和英语水平等保护变量的多样性;3)数据集包含了451份出院摘要,超过54k个句子,以及根据性别、种族和英语水平分组的多样化的患者群体。
使用方法
MedDec数据集的使用方法包括:1)作为医疗决策提取和分类的基准数据集,用于开发新的模型和方法;2)作为研究不同医疗决策模式和分析医疗决策过程的数据集;3)作为研究医疗决策中潜在不平等的数据集,以提供有关解决医疗保健不平等方面的见解。
背景与挑战
背景概述
MedDec数据集是一项旨在从临床记录中提取医疗决策的突破性研究,该研究由Elgaar、Cheng、Vakil和Amiri等人于2024年8月发表。该数据集包含来自MIMIC-III数据库的451份出院摘要,涵盖了超过54k个句子,并基于性别、种族和英语熟练程度对多样化的患者群体进行了分类。MedDec数据集的核心研究问题是从临床记录中提取医疗决策,并将其分类为10种不同的类型,包括“联系相关”、“获取信息”、“定义问题”、“治疗目标”、“药物”、“治疗程序”、“评估测试结果”、“延期”、“建议和预防”以及“法律/保险相关”。该数据集为理解医疗决策过程提供了宝贵的资源,并有望推动基于证据的决策制定指南和管理计划的发展。
当前挑战
MedDec数据集在构建过程中面临的主要挑战包括:1) 临床记录中存在不精确的描述和异构数据,这给自动知识提取带来了困难;2) 数据集的构建需要专家对每个出院摘要中的医疗决策进行标注,这需要大量的时间和专业知识;3) 数据集中的医疗决策分布不均,这可能导致模型训练过程中的偏差,并影响模型的预测能力。此外,MedDec数据集的研究还揭示了医疗决策提取的复杂性,包括决策跨度的长度和所涉及的医疗概念的数量。这些挑战表明,医疗决策提取是一个复杂且具有挑战性的任务,需要进一步的研究和改进。
常用场景
经典使用场景
MedDec数据集的经典使用场景在于从临床笔记中提取医疗决策。该数据集包含11种不同表型的临床笔记,并由10种类型的医疗决策进行标注。MedDec数据集的目的是共同提取和分类临床笔记中的不同类型的医疗决策,为医疗决策的自动提取和分类提供了基础。通过对MedDec数据集的分析,可以揭示临床决策提取的复杂性,并为未来在该领域的研究提供参考。
实际应用
MedDec数据集在实际应用中具有广泛的应用场景。首先,MedDec数据集可以用于开发医疗决策自动提取和分类系统,帮助医疗人员更快速、准确地提取医疗决策信息,从而提高医疗决策的效率和质量。其次,MedDec数据集可以用于研究医疗决策的规律和模式,为医疗决策的制定和优化提供参考。此外,MedDec数据集还可以用于评估医疗决策的公平性和有效性,为医疗政策的制定和改进提供支持。
衍生相关工作
MedDec数据集的发布推动了生物自然语言处理技术在医疗决策提取和分类方面的研究。在此基础上,一些研究工作进一步探索了医疗决策提取和分类的方法和模型。例如,一些研究工作提出了基于深度学习的医疗决策提取和分类模型,并取得了较好的性能。此外,一些研究工作还探索了医疗决策提取和分类的应用场景,例如用于开发智能医疗助手、辅助医疗决策等。这些研究工作进一步推动了医疗决策提取和分类技术的发展,并为医疗决策的自动提取和分类提供了新的思路和方法。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作