five

katielink/nejm-medqa-diagnostic-reasoning-dataset

收藏
Hugging Face2024-01-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/katielink/nejm-medqa-diagnostic-reasoning-dataset
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含三个配置:medqa_test、medqa_train和nejm_test,每个配置包含不同的特征和分割信息。数据集的特征包括问题、答案、诊断信息、评分等。数据集来源于一篇关于大语言模型在医学中可解释性的文章。

该数据集包含三个配置:medqa_test、medqa_train和nejm_test,每个配置包含不同的特征和分割信息。数据集的特征包括问题、答案、诊断信息、评分等。数据集来源于一篇关于大语言模型在医学中可解释性的文章。
提供机构:
katielink
原始信息汇总

数据集概述

许可证

  • CC BY 4.0

标签

  • medical

数据集配置

medqa_test

  • 特征:
    • index: float64
    • question: string
    • answer: string
    • new_IR: string
    • IR Grade: string
    • new_AR: string
    • AR Grade: string
    • new_BR: string
    • BR Grade: string
    • new_DR: string
    • DR Grade: string
    • CoT: string
    • CoT.1: string
    • GPT-4->: string
    • CoT.2: string
    • Rationale: string
    • CoT Grade: string
    • DR: string
    • Rationale.1: string
    • DR Grade.1: string
    • IR: string
    • Rationale.2: string
    • IR Grade.1: string
    • AR: string
    • Rationale.3: string
    • AR Grade.1: string
    • BR: string
    • Rationale.4: string
    • BR Grade.1: string
    • Unnamed: 29: float64
    • Unnamed: 30: string
  • 分割:
    • train:
      • 字节数: 2863244
      • 样本数: 513
  • 下载大小: 1507249
  • 数据集大小: 2863244

medqa_train

  • 特征:
    • question: string
    • answer: string
    • diag_IR1: string
    • grade (1 for y , 2 for n): float64
    • diag_AR1: string
    • grade: int64
    • diag_BR1: string
    • grade.1: int64
    • diag_DR1: string
    • grade.2: int64
    • diag_IR2: string
    • grade.3: int64
    • diag_AR2: string
    • grade.4: int64
    • diag_BR2: string
    • grade.5: int64
    • diag_DR2: string
    • grade.6: int64
    • diag_IR3: string
    • grade.7: int64
    • diag_AR3: string
    • grade.8: int64
    • diag_BR3: string
    • grade.9: int64
    • diag_DR3: string
    • grade.10: int64
    • diag_IR4: string
    • grade.11: int64
    • diag_AR4: string
    • grade.12: int64
    • diag_BR4: string
    • grade.13: int64
    • diag_DR4: string
    • grade.14: int64
    • diag_IR5: string
    • grade.15: int64
    • diag_AR5: string
    • grade.16: int64
    • diag_IR6: string
    • grade.17: int64
    • diag_AR6: string
    • grade.18: int64
  • 分割:
    • train:
      • 字节数: 140480
      • 样本数: 96
  • 下载大小: 106580
  • 数据集大小: 140480

nejm_test

  • 特征:
    • DOI: string
    • Title: string
    • Lab Data: string
    • Answer: string
    • Initial Answer: string
    • BLINDED_1: string
    • BLINDED_2: string
    • BLINDED_1.1: string
    • CoT_response: string
    • CoT answer: string
    • CoT Grade: string
    • DR_response: string
    • DR answer: string
    • DR grade: string
  • 分割:
    • train:
      • 字节数: 10643219
      • 样本数: 301
  • 下载大小: 3610707
  • 数据集大小: 10643219

配置文件

  • medqa_test:
    • 数据文件:
      • train: medqa_test/train-*
  • medqa_train:
    • 数据文件:
      • train: medqa_train/train-*
  • nejm_test:
    • 数据文件:
      • train: nejm_test/train-*
搜集汇总
数据集介绍
main_image_url
构建方式
katielink/nejm-medqa-diagnostic-reasoning-dataset数据集的构建,旨在通过医学诊断推理的案例,为大型语言模型在医学领域的可解释性研究提供支持。该数据集整合了多个配置,包括medqa_test、medqa_train和nejm_test,每个配置均包含了问题、答案以及不同诊断推理的级别和评分,这些数据来源于医学文献和实际案例,经过严格的标注和分类,形成了结构化且具有研究价值的资源库。
使用方法
使用该数据集时,研究者可以根据具体的研究需求选择不同的配置。例如,medqa_test配置可用于评估模型在医学诊断推理任务中的性能,而medqa_train和nejm_test配置则提供了丰富的训练和测试数据。用户可以通过HuggingFace提供的工具和接口,方便地加载、处理和分析这些数据,进而开展医学诊断推理相关的研究工作。
背景与挑战
背景概述
在医学诊断领域,诊断推理是一项关键任务,其核心在于通过对病患信息的分析,推断出正确的诊断结果。katielink/nejm-medqa-diagnostic-reasoning-dataset数据集是在这一背景下产生的,旨在为医学诊断推理研究提供标准化的数据支持。该数据集由Savage等人创建于2024年,主要研究人员来自于多个医学及计算机科学交叉领域的研究团队,他们通过对《新英格兰医学杂志》(NEJM)中病例的分析,构建了这一包含问题、答案以及诊断推理评分的数据集。该数据集的发布对于推动医学诊断模型的开发与评估具有重要的影响力,为相关领域的研究提供了宝贵的资源。
当前挑战
该数据集在构建过程中面临的挑战主要包括数据的准确性与可靠性验证,以及如何确保数据集能够全面覆盖医学诊断推理中的各种场景。具体挑战体现在:一是确保收集的病例数据具有代表性,能够反映实际临床中的多样性;二是诊断推理评分的主观性,需要通过专家审核来保证评分的准确性;三是数据集构建过程中的隐私保护问题,需要确保患者信息的安全。在所解决的领域问题方面,该数据集的挑战在于如何利用这些数据有效地训练和评估医学诊断模型,以提高模型的诊断准确性和推理能力。
常用场景
经典使用场景
在医学诊断推理的研究领域,katielink/nejm-medqa-diagnostic-reasoning-dataset数据集被广泛用于评估和提升机器学习模型在临床问题解决中的性能。该数据集通过提供一系列医学问题、答案以及相关的诊断推理信息,成为研究医学自然语言处理和临床决策支持系统的重要资源。
解决学术问题
该数据集解决了医学文本理解、诊断推理自动化以及模型解释性等关键学术问题。它为研究人员提供了一个标准化的平台,以评估模型在处理医学诊断问题时的准确性和可靠性,进而推动医学人工智能的发展。
实际应用
在实际应用中,该数据集的应用场景包括但不限于辅助医生进行诊断决策、提供医学教育训练以及促进医学研究。它通过模拟真实的临床问题,帮助构建更加精准和智能的医学诊断系统,为患者提供更加高效和准确的医疗服务。
数据集最近研究
最新研究方向
在医学诊断推理领域,研究者们正致力于探索大型语言模型的可解释性。katielink/nejm-medqa-diagnostic-reasoning-dataset数据集为此提供了重要的研究资源,其包含的问题和答案以及诊断推理的评分,为评估和提升模型在医学诊断中的准确性和可靠性提供了基准。近期研究聚焦于利用该数据集对模型的诊断推理能力进行训练和测试,以期在临床决策支持系统中实现更高效的辅助诊断。该数据集的运用不仅推动了医学自然语言处理技术的发展,也对提高医疗质量和患者安全产生了深远影响。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作