five

Meddies/meddies-patient-safety

收藏
Hugging Face2026-04-25 更新2026-04-26 收录
下载链接:
https://hf-mirror.com/datasets/Meddies/meddies-patient-safety
下载链接
链接失效反馈
官方服务:
资源简介:
Meddies Patient Safety 是一个越南临床红队数据集,包含22,336个合成患者查询和19,085个通过LLM-as-judge质量标准的医生-LLM响应。该数据集旨在评估临床LLM中的患者安全性,涵盖五种不安全的响应模式:健康错误信息、有害医疗建议、无执照行医、诊断过度自信和偏见/歧视。数据集分为问题和答案两个配置,分别用于训练和测试。数据集适用于临床LLM安全性评估、监督微调或拒绝调优实验。

Meddies Patient Safety is a Vietnamese clinical red-team dataset comprising 22,336 synthetic patient queries and 19,085 doctor-LLM responses that passed LLM-as-judge quality criteria. The dataset is designed to evaluate patient safety in clinical LLMs, covering five unsafe response modes: health misinformation, harmful medical advice, unlicensed practice, misdiagnosis overconfidence, and bias/discrimination. The dataset is divided into two configs, questions and answers, for training and testing purposes. It is suitable for clinical LLM safety evaluation, supervised fine-tuning, or refusal-tuning experiments.
提供机构:
Meddies
搜集汇总
数据集介绍
main_image_url
构建方式
Meddies Patient Safety数据集基于患者安全领域的临床需求而生,聚焦越南语环境中大型语言模型在医疗场景下的潜在风险。构建过程从虚拟患者画像库与五项不安全响应策略出发,自动生成涵盖健康谣言、有害医疗建议、无证行医、误诊自信及偏见歧视等维度的患者查询。随后由具备思维链能力的医生模型生成回答,并通过大语言模型评判者筛选出质量达标的对话对。数据集分为questions与answers两个配置,前者包含22336条未配对的查询,后者则提供18257条训练样本与828条测试样本,且测试集与训练集查询无重叠。此外,部分虚拟画像还融入了主诉、病史、社会障碍等深层结构,以提升语境的真实性与丰富性。
使用方法
使用者可通过HuggingFace的datasets库便捷加载数据,支持按配置名称选取questions或answers,并指定train或test拆分。answers配置中的messages字段采用标准对话格式,可直接接入监督微调框架或拒绝性评估流程。policy字段为五项安全策略的标签,便于进行针对性错误模式分析;persona字段以JSON字符串存储,可解析出患者背景与临床细节,支持基于画像属性的条件切片。由于测试集内健康谣言样本稀少,研究者在使用时应警惕评分偏差,建议搭配自有评判模型对回答质量进行鲁棒性校验,以全面检验模型在越南语临床场景下的安全边界。
背景与挑战
背景概述
Meddies Patient Safety 数据集由 Meddies 团队于2026年创建,聚焦于越南语临床大语言模型(LLM)的患者安全问题。随着医疗AI在非英语环境中的部署,模型可能因口语化表述、民间偏方引用或家庭驱动的提问风格而输出危险内容,而现有英文基准难以覆盖这一场景。该数据集包含22,336条合成患者查询和19,085条经过LLM评委筛选的医生回答,旨在探测模型在健康误导、有害医疗建议、无证行医、诊断过度自信及偏见歧视五类不安全响应模式上的脆弱性。作为首个越南语临床红队数据集,它填补了多语言医疗安全评估的空白,为研究者和开发者提供了压力测试工具,推动AI在真实世界医疗场景中的稳健部署。
当前挑战
该数据集面临的核心挑战在于多维度安全问题。领域问题层面,临床LLM的安全评估不能仅依赖单一基准,模型可能因提问方式的微小差异而输出危险剂量建议或虚假信息,尤其在越南语环境中,民间偏方和口语化表达增加了不安全响应的隐蔽性。构建过程中,团队需应对合成数据与真实临床场景的差距:医生回答由LLM生成,并非真实临床指南,存在潜在的不准确风险;人物角色增强仅覆盖部分数据,缺乏完整的隐私脱敏机制;测试集在政策类别上存在不平衡,如健康误导类别仅占2.3%,可能导致评估结果偏向其他模式;此外,LLM评委的评分标准在生成批次间不一致,无法直接复用,下游团队需自行校准评估机制。
常用场景
经典使用场景
在临床大语言模型的安全评估与对齐领域中,Meddies Patient Safety数据集被广泛用于红队测试,尤以越南语环境为独特切入点。该数据集包含超过两万条合成患者查询,覆盖健康错误信息、有害医疗建议、无证行医、过度自信误诊以及偏见歧视五大不安全响应模式。研究者通过将模型输出与经过LLM评判员过滤的医生-LLM回答进行对比,可系统性地检测模型在面对语言表述隐晦、民间医学混杂及家庭驱动式问诊风格时的脆弱性边界。其分策略设计的训练与测试拆分结构,支持对特定不安全行为的定向压力测试,是越语临床LLM安全基线建立的基石资源。
解决学术问题
该数据集精准回应了非英语临床场景下大语言模型安全性评估的长期缺位问题。现有安全基准多植根于英语文化语境,难以捕捉越南本土特有的民间偏方逻辑、地域性求医话术以及族裔经济-社会差异引发的偏见风险。Meddies Patient Safety通过构建具备交错社会背景的增强型真实人物画像,使研究者能够量化评估模型在面对复杂人文语境时的错误倾向漂移。其填补了低资源语言背景下临床LLM拒答机制、指令微调与红队评测方法论的交汇空白,推动了多语言医疗AI安全评价体系的范式演进。
实际应用
在产业落地层面,该数据集主要服务于越南地区医疗健康AI产品的安全性调优与合规性验证。开发者可借助问答配置直接接入监督微调管线,用于增强生成式AI在问诊建议、药物剂量提醒及症状归因等环节的风险控制能力。同时,其测试拆分与策略标签支持自动化的持续性安全监控流水线:由模型的不安全响应比率变化反推对话引擎的未对齐漂移。此外,数据集被医疗机构或第三方审计团队用作模拟患者交互沙盒,在不触及真实病例隐私的前提下暴露临床AI的可能危害路径,成为上市前安全认证流程的有机组成部分。
数据集最近研究
最新研究方向
在临床大语言模型安全评估领域,Meddies Patient Safety数据集的前沿研究方向聚焦于构建越南语语境下细粒度的红队测试框架,针对五类高危响应模式(健康 misinformation、有害医疗建议、无证行医、过度自信误诊及偏见歧视)进行系统性压力测试。其创新之处在于融合了越南本土化的口语化表达、民间偏方引用及家庭驱动的问诊风格,填补了现有英语基准无法覆盖的文化特异性安全漏洞。该数据集通过超过2.2万条合成患者查询与经LLM裁判筛选的医生模型回答配对,为安全对齐微调、拒绝行为评估及语言模型在非英语医疗场景中的部署前验证提供了关键资源,标志着临床AI安全研究向低资源语言领域的重要拓展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作