Patient-Message-Response-Drafting

Hugging Face2026-01-19 更新2026-01-20 收录

下载链接：

https://huggingface.co/datasets/PortalPal-AI/Patient-Message-Response-Drafting

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集旨在评估大型语言模型（LLMs）在患者门户通信中对患者消息的响应能力。每个半合成的患者消息都与我们合作医院患者的真实去识别化电子健康记录（EHR）配对。每个医生响应均由临床医生根据临床响应主题（如询问症状相关问题、给予医疗治疗指令等）编写。临床专家在编写响应时可以从EHR和患者消息中提取信息。数据集中的EHR元素是真实的且完全去识别化，所有消息均为合成生成。所有数据均经过IRB和合作医院的批准公开发布。

创建时间：

2026-01-16

原始信息汇总

数据集概述

基本信息

数据集名称: Patient-Message-Response-Drafting
发布平台: Hugging Face
许可证: MIT
主要任务类别: 文本生成
主要语言: 英语
标签: 医疗、医疗保健、临床、健康、医生、患者
数据规模: 小于1K样本

数据集目的与内容

该数据集旨在评估大型语言模型在患者门户通信中响应患者消息的能力。
每个半合成的患者消息都与来自合作医院患者的真实、去标识化的电子健康记录配对。
每条医生回复均由临床医生撰写，并遵循临床医生回复主题（例如询问症状相关问题、给出医疗治疗指示等）。
临床专家在撰写回复时，允许从电子健康记录和患者消息中提取信息。

数据注释与来源

每条回复均由一位拥有15年以上初级保健经验的医学博士单独撰写。
数据集中的电子健康记录元素是真实的且完全去标识化。
所有患者消息均为合成生成。
所有数据均已获得机构审查委员会和合作医院的批准，可公开发布。

相关论文与引用

论文标题: How Much Would a Clinician Edit This Draft? Evaluating LLM Alignment for Patient Message Response Drafting
论文链接: https://arxiv.org/abs/2601.11344
引用格式:

@misc{seegmiller2026clinicianediteval, title={How Much Would a Clinician Edit This Draft? Evaluating LLM Alignment for Patient Message Response Drafting}, author={Parker Seegmiller and Joseph Gatto and Sarah E. Greer and Ganza Belise Isingizwe and Rohan Ray and Timothy E. Burdick and Sarah Masud Preum}, year={2026}, eprint={2601.11344}, archivePrefix={arXiv}, primaryClass={cs.CL}, url={https://arxiv.org/abs/2601.11344}, }

搜集汇总

数据集介绍

构建方式

在医疗健康信息学领域，构建高质量的数据集对于评估大型语言模型在临床沟通中的表现至关重要。Patient-Message-Response-Drafting数据集采用半合成方法精心构建，其中患者消息为合成生成，而电子健康记录则源自合作医院的真实且完全去标识化数据。临床医生基于患者消息和电子健康记录，依据预设的临床响应主题（如询问症状、提供治疗指导等）撰写回复，每位标注者均为拥有超过15年基层医疗经验的医学博士，确保了回复的专业性和临床相关性。

使用方法

在应用该数据集时，研究者可将其用于评估大型语言模型在起草患者消息回复时的对齐能力和临床适用性。典型使用方法包括训练或微调模型以生成符合临床主题的响应，或作为基准测试集，通过比较模型输出与专家撰写的回复来衡量模型性能。用户需遵循数据集的许可协议，并在相关研究中引用原始论文，以确保学术规范性和数据溯源性。

背景与挑战

背景概述

随着大型语言模型在医疗健康领域的应用日益广泛，其在患者门户通信中的自动化响应生成能力成为研究焦点。Patient-Message-Response-Drafting数据集由Parker Seegmiller等人于2026年创建，旨在评估语言模型在起草回复患者消息时的临床对齐性。该数据集结合了半合成的患者消息与真实的去标识化电子健康记录，并由具有超过15年基层医疗经验的医生撰写专业回复，核心研究问题聚焦于模型生成内容与临床实践需求的契合程度。这一工作为提升医疗通信的效率和准确性提供了重要的实证基础，推动了人工智能辅助临床决策的发展。

当前挑战

该数据集致力于解决患者消息响应自动生成这一领域问题，其核心挑战在于确保生成回复的临床准确性、安全性与人性化表达，避免误导性医疗建议。在构建过程中，研究人员面临多重困难：一是如何平衡合成消息的真实性与隐私保护，需在模拟真实临床场景的同时彻底去标识化敏感信息；二是依赖资深临床专家进行标注，导致数据规模受限，可能影响模型的泛化能力；三是整合电子健康记录与患者消息的复杂性，要求回复既基于结构化数据又兼顾非结构化文本的语境理解。

常用场景

经典使用场景

在医疗健康信息学领域，Patient-Message-Response-Drafting数据集为评估大型语言模型在患者门户通信中的表现提供了基准。该数据集通过结合半合成的患者消息与真实的去识别化电子健康记录，模拟了临床医生撰写回复的实际场景。其经典使用场景聚焦于测试模型能否生成符合临床响应主题（如询问症状、提供治疗指导）的草稿，从而衡量模型与医疗专业实践的契合度。这一应用直接服务于提升自动化患者沟通工具的可靠性与安全性。

解决学术问题

该数据集致力于解决自然语言处理在医疗领域的关键学术问题，即如何评估大型语言模型生成内容的临床对齐性。传统模型评估往往缺乏专业医疗背景的监督，而此数据集通过引入资深临床医生撰写的真实回复作为黄金标准，为量化模型输出与专业医疗实践之间的差距提供了实证基础。其意义在于推动了医疗人工智能从通用文本生成向专业化、安全敏感型应用的转型，为后续研究设立了严谨的评估框架。

实际应用

在实际医疗环境中，Patient-Message-Response-Drafting数据集可应用于优化患者门户系统的自动化回复功能。通过基于该数据集训练的模型，医疗机构能够辅助临床医生高效处理患者咨询，减轻其行政负担，同时确保回复内容的准确性与专业性。此外，它还可用于开发智能临床决策支持工具，提升远程医疗服务的响应质量与一致性，最终增强患者护理的连续性与可及性。

数据集最近研究