knowrohit07/know_medical_dialogues
收藏Hugging Face2023-10-12 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/knowrohit07/know_medical_dialogues
下载链接
链接失效反馈官方服务:
资源简介:
knowrohit07/know_medical_dialogues数据集是一个包含患者与医生之间关于各种医疗话题对话交流的集合,旨在捕捉个体关于健康的复杂性和不确定性以及提供的医疗指导。该数据集特别适合用于训练大型语言模型(LLMs),以理解和生成医学信息对话,尤其是在医疗资源有限的场景中。数据来源于匿名化的患者-医生互动和GPT4生成的合成对话,经过精心策划以确保不包含个人身份信息。数据集的优势包括涵盖广泛的医疗查询和建议,捕捉从症状查询到护理后指令的多样化互动,以及专门为微调LLMs进行医疗对话而设计。
提供机构:
knowrohit07
原始信息汇总
🩺 数据集描述
knowrohit07/know_medical_dialogues 数据集是一系列患者与医生之间关于各种医疗主题的对话交流集合。该数据集旨在捕捉个人关于其健康状况的复杂性、不确定性和提出的问题,以及医生提供的相应医疗指导。
🎯 预期用途
该数据集旨在用于训练大型语言模型(LLMs),专注于理解和生成医学对话。它非常适合那些旨在提供医疗信息或见解的LLM应用,特别是在医疗资源有限的场景中。
❗ 局限性
尽管该数据集包含了多样化的交互,但它并未涵盖所有医疗场景。基于此数据集训练的模型应被视为额外的资源,而非专业医疗咨询的替代品。
📌 数据来源
对话种子任务或交流是从匿名的患者-医生互动中收集的,并使用GPT4进行了合成处理。
📋 收集方法
数据经过精心策划,确保没有个人身份信息残留。所有对话均代表一般关注点和建议,不包含具体病例细节。
数据字段
- description: 对话背景的简要总结。
- utterances: 包含患者和医生之间顺序的陈述列表。
🌟 数据集优势
- 广泛范围: 数据集涵盖了广泛的医疗查询和建议,适用于一般的医疗对话AI。
- 多样化交互: 从症状查询到术后护理指导,涵盖了各个方面。
- LLMs训练潜力: 专门为微调LLMs以进行医疗对话而设计,增强了模型在该领域的能力。
⚖️ 伦理和影响考虑
- 积极影响: 利用基于此数据集训练的LLMs可以为医疗专业人员提供巨大价值,特别是在医疗数据集有限的地区。当部署在经济实惠的本地设备上时,医生可以利用AI辅助工具,增强其咨询和决策过程。
- 潜在风险: 模型提供指导可能不符合最新的医疗指南或特定患者需求的风险。向用户明确指出,LLM的输出应补充专业医疗意见至关重要。
- 建议: 鼓励医疗专业人员将此工具作为初步参考点,而非医疗决策的主要基础。



