medical-triage-triples

Hugging Face2026-04-13 更新2026-04-14 收录

下载链接：

https://huggingface.co/datasets/kunalkachru23/medical-triage-triples

下载链接

链接失效反馈

官方服务：

资源简介：

Medical Triage RL Triples 是一个来自 Medical Triage OpenEnv 环境 (v2.3.0) 的强化学习数据集，包含 '(observation, action, reward)' 三元组。数据集涵盖11种临床任务和75个患者案例，每个案例包含完整的临床描述文本、任务指令提示、智能体响应JSON、标量奖励值以及详细的评分分解。奖励计算基于NHS NEWS2、PEWS (Duncan 2006)、SOFA (Vincent 1996)、SSC Hour-1 Bundle 2021和NHS SBAR 2018等标准。数据集字段包括任务ID、案例ID、患者病史、任务描述、智能体动作、奖励值、评分分解和模型类型。适用于医疗分诊相关的强化学习研究和应用。

创建时间：

2026-04-12

原始信息汇总

Medical Triage RL Triples 数据集概述

数据集简介

该数据集包含来自 Medical Triage OpenEnv 环境（版本 v2.3.0）的 (observation, action, reward) 三元组。

数据字段

字段	描述
`task_id`	11项临床任务之一
`case_id`	唯一的患者病例标识符
`patient_history`	完整的临床表现文本
`task_description`	智能体指令提示
`action`	智能体响应的 JSON 数据
`reward`	标量奖励，范围在 (0.0001, 0.9999)
`score_breakdown`	各维度得分明细
`model`	使用的模型或智能体类型

任务与规模

任务数量：11项临床任务。
病例数量：75个病例。
任务列表：simple_triage, conflicting_vitals, masked_deterioration, demographic_fairness, deteriorating_patient, sepsis_bundle, paediatric_triage, medication_reconciliation, icu_deterioration, sbar_handover, differential_diagnosis。

评分机制

奖励由确定性的部分学分评分器计算，其依据包括 NHS NEWS2、PEWS (Duncan 2006)、SOFA (Vincent 1996)、SSC Hour-1 Bundle 2021 和 NHS SBAR 2018。

数据来源

数据通过 scripts/export_hf_dataset.py 脚本从 kunalkachru23/medical-triage-env v2.3.0 生成。

搜集汇总

数据集介绍

构建方式

在医疗分诊领域，数据集的构建依赖于模拟临床决策环境。该数据集源自Medical Triage OpenEnv环境（版本2.3.0），通过脚本export_hf_dataset.py从kunalkachru23/medical-triage-env导出，生成了包含观察、行动和奖励的三元组结构。每个条目涵盖11项临床任务，涉及75个独特患者案例，奖励值基于NHS NEWS2、PEWS、SOFA等权威医疗评分系统进行确定性部分信用评估，确保了数据与真实临床实践的一致性。

特点

该数据集的核心特征在于其结构化三元组设计，其中观察部分包含完整的临床呈现文本，行动部分以JSON格式记录代理响应，奖励则采用标量形式分布在0.0001至0.9999之间。数据集覆盖了从简单分诊到脓毒症管理、儿科分诊及病情恶化监测等多样化临床场景，每个案例均附有任务描述和分数细分，模型类型信息亦被记录，为强化学习研究提供了多维度的评估基础。

使用方法

使用该数据集时，研究人员可将其应用于医疗决策支持系统的开发与评估。通过解析任务描述和患者历史，模型能够学习在复杂临床情境下生成符合医疗准则的行动序列。奖励机制允许对代理行为进行量化分析，分数细分为性能优化提供了具体方向。数据集支持跨任务比较，适用于训练和验证强化学习算法在医疗分诊领域的泛化能力与公平性表现。

背景与挑战

背景概述

医疗分诊作为急诊医学的核心环节，其决策过程直接影响患者预后与医疗资源分配效率。近年来，强化学习技术在模拟临床决策支持系统中展现出潜力，但缺乏高质量、结构化的训练数据制约了其发展。在此背景下，Medical Triage RL Triples数据集应运而生，由研究团队基于开源环境Medical Triage OpenEnv（v2.3.0）构建，旨在提供涵盖11项临床任务的观察-行动-奖励三元组数据。该数据集以英国国家早期预警评分（NEWS2）、儿科早期预警评分（PEWS）等权威临床指南作为奖励计算依据，为开发可靠的分诊决策智能体奠定了实证基础。

当前挑战

该数据集致力于解决医疗分诊决策自动化中的核心挑战，即如何在复杂、动态的临床场景中生成符合专业指南且具有泛化能力的行动序列。具体而言，其构建面临多重困难：一是临床任务的多样性，涵盖从简单分诊到脓毒症束治疗等11类异质性任务，要求奖励函数能够精确量化不同维度的临床合规性；二是数据生成的可靠性，需确保三元组中的行动与奖励严格遵循NHS NEWS2、SOFA评分等多项国际标准，避免引入主观偏差；三是病例设计的代表性，75个病例需平衡常见病症与危急情境，以模拟真实世界分诊决策的复杂性。

常用场景

经典使用场景

在医疗决策支持领域，Medical Triage RL Triples数据集为强化学习算法的训练与评估提供了关键资源。其经典使用场景聚焦于模拟临床分诊环境，通过包含观察、行动和奖励的三元组结构，使智能体能够学习在复杂医疗情境下做出合理决策。该数据集覆盖了从简单分诊到脓毒症管理等多种临床任务，为研究者构建和优化医疗AI代理提供了标准化测试平台。

实际应用

在实际医疗场景中，该数据集支撑的开发工作有望转化为临床辅助工具。例如，基于该数据集训练的模型可集成到急诊分诊系统或ICU预警平台中，协助医护人员快速识别病情恶化风险、优化资源分配或减少诊断偏差。这些应用旨在提升医疗服务的效率与公平性，为应对临床工作负荷和减少人为错误提供数据驱动的解决方案。

衍生相关工作

围绕该数据集已衍生出一系列探索医疗强化学习前沿的经典工作。研究者利用其三元组结构开发了离线强化学习、模仿学习以及策略评估的新方法。相关研究不仅验证了算法在模拟分诊任务中的有效性，还深入分析了智能体决策的伦理影响与临床合理性，为构建下一代可信赖的医疗AI系统奠定了理论与实验基础。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集