MedNurse-QA

Hugging Face2025-08-10 更新2025-08-11 收录

下载链接：

https://huggingface.co/datasets/NevenaD/MedNurse-QA

下载链接

链接失效反馈

官方服务：

资源简介：

MedNurse-QA数据集是一个针对护理教育设计的问答数据集，包含了21,648个问题-答案对，这些问题-答案对是基于开放资源RN教科书生成的。数据集内容经过GPT-4.0的辅助生成，并由注册护士进行了仔细的审查和修订，以确保准确性、相关性和与护理教育的一致性。该数据集旨在支持面向护理学生和医疗专业人员的AI驱动教育工具，并遵循知识共享署名4.0（CC-BY 4.0）许可。

创建时间：

2025-08-09

原始信息汇总

MedNurse-QA 数据集概述

数据集摘要

名称: MedNurse-QA
用途: 护理教育领域的问答数据集
数据量: 21,648个问答对
数据来源: Open RN教科书（《Fundamentals in Nursing》《Nursing Pharmacology》《Nursing Skills》）
创建方法: 使用GPT-4.0生成初始问答对，并由注册护士审核验证
质量保证: 移除错误或误导性内容（特别是药物计算部分）
核心主题: 患者护理、临床程序、药理学、专业护理实践

支持任务

封闭领域问答（回答护理相关问题）
教育AI（训练护理教育虚拟导师）
临床决策支持系统（增强AI学习平台）

语言

英语（"en"）

数据集结构

数据实例

json { "book": "Nursing Fundamentals", "chapter": "Communication", "subchapter": " Basic communication concepts ", "question": "How should nurses deal with differing perspectives? ", "answer": " Nurses should communicate in a nonjudgmental manner, respecting patients beliefs and perspectives." }

问题长度: 12.0至176.0字符
答案长度: 2.0至315字符

数据字段

"book"（字符串）: 来源教科书名称
"chapter"（字符串）: 主话题或章节标题
"subchapter"（字符串）: 章节内具体部分
"question"（字符串）: 护理相关问题
"answer"（字符串）: 正确答案

数据拆分

当前为单一问答对集合，用户需自行创建训练/验证/测试集

数据集创建

创建理由

解决护理教育领域缺乏特定问答数据集的问题

源数据

原始来源: CC-BY 4.0许可的Open RN教科书
处理: 使用GPT-4.0生成问答对，保持与原文一致
标注: 由注册护士手动检查验证
隐私: 不包含个人身份信息（PII）

使用注意事项

预期用途

护理教育AI模型的训练与评估
护理学生/医疗专业人员的虚拟导师开发
护理领域问答应用开发
护理教育培训的聊天机器人及智能辅导系统

限制

非临床使用：仅限教育用途
潜在偏见：基于美国护理教科书，可能未涵盖地区差异
时间敏感性：护理指南会更新，部分答案可能过时

许可信息

许可证: Creative Commons Attribution 4.0 International (CC-BY 4.0)
署名要求: 必须注明Open RN原始来源（https://www.cvtc.edu/grants/open-rn）

引用信息

APA格式

Dicheva, N. K., Rehman, I. U., Husamaldin, L., & Aleshaiker, S. (2025). MedNurse-QA (v1.0) [Data set]. Hugging Face. https://doi.org/10.57967/hf/6193

BibTeX格式

bibtex @misc{dicheva_mednurse_qa_2025, author = {Dicheva, N. K. and Rehman, I. U. and Husamaldin, L. and Aleshaiker, S.}, title = {MedNurse-QA (v1.0)}, year = {2025}, publisher = {Hugging Face}, doi = {10.57967/hf/6193}, url = {https://huggingface.co/datasets/NevenaD/MedNurse-QA} }

搜集汇总

数据集介绍

构建方式

在护理教育领域，高质量的数据资源对于培养专业人才至关重要。MedNurse-QA数据集通过系统化的构建流程，从Open RN教材中提取核心知识，采用GPT-4.0生成初始问答对，并由注册护士进行严格审核与修正，确保内容的专业性和准确性。构建过程中特别剔除了药物计算等易错内容，最终形成涵盖基础护理、药理知识和临床技能三大模块的21,648组问答对，每组数据均标注了原始教材的章节信息，为后续研究提供可追溯的学术依据。

特点

作为护理教育领域的专用数据集，MedNurse-QA展现出鲜明的专业特色。其问答内容严格遵循美国护理课程体系，覆盖患者护理、临床操作等核心场景，问题长度12-176字符与答案长度2-315字符的差异化设计，精准模拟真实教学情境。数据集采用层次化元数据结构，通过教材-章节-子章节三级标注体系，支持多维度的知识检索与分析。特别值得注意的是，所有内容均通过医疗专业人员的人工验证，在保持CC-BY 4.0开放许可的同时，确保了学术严谨性。

使用方法

该数据集为护理教育智能化研究提供了丰富资源。研究者可直接加载标准化的JSON格式数据，根据教学需求自定义训练集与测试集划分。典型应用场景包括开发护理知识问答系统、构建智能辅导工具等，但需注意其设计初衷为教学辅助而非临床决策。使用时应充分考虑美国护理实践的区域性特征，并定期核查内容与最新医疗指南的同步性。为符合学术规范，任何衍生成果均需引用原始Open RN教材及本数据集DOI标识。

背景与挑战

背景概述

MedNurse-QA数据集诞生于2025年，由Dicheva、Rehman等学者基于Open RN护理学教材构建，标志着护理教育领域人工智能应用的重要突破。该数据集包含21,648个经过注册护士审核的问答对，覆盖基础护理理论、药理知识和临床操作三大核心模块，填补了护理教育领域高质量问答数据集的空白。通过融合GPT-4.0的智能生成与专业人工校验的双重机制，该数据集不仅严格遵循美国护理课程体系，更通过CC-BY 4.0许可协议促进开源教育生态发展，为智能辅导系统、临床决策支持工具等AI教育应用提供了标准化基准。

当前挑战

在解决护理教育领域问答系统构建方面，该数据集面临三大核心挑战：专业术语的精确解析要求模型具备跨医学与教育领域的知识融合能力；临床场景的多样性导致问答对需要覆盖从基础理论到复杂病例的广泛谱系；美国教材的区域局限性使得模型泛化需克服国际护理实践差异。数据构建过程中，生成式AI产生的药物剂量计算错误需人工逐条修正，专业护士的验证工作带来高昂的标注成本，而快速更新的临床指南则要求建立持续的知识更新机制。这些挑战突显了医疗教育数据特有的准确性、时效性与专业性三重约束。

常用场景

经典使用场景

在护理教育领域，MedNurse-QA数据集为人工智能驱动的教育工具提供了重要支持。该数据集通过高质量的问答对，广泛应用于虚拟导师系统的训练，帮助护理学生掌握核心护理知识，如患者护理、临床操作和药理学等。其结构化设计使得模型能够精准理解并回答护理相关问题，成为护理教育中不可或缺的资源。

解决学术问题

MedNurse-QA数据集解决了护理教育中缺乏高质量、领域特定问答数据的学术问题。通过整合Open RN教材内容，并结合专业护士的审核，该数据集确保了内容的准确性和教育价值。它不仅填补了护理教育数据集的空白，还为自然语言处理模型在专业领域的微调提供了可靠基础，推动了教育技术与护理学的交叉研究。

衍生相关工作

围绕MedNurse-QA数据集，已衍生出多项经典研究工作，包括智能虚拟导师系统的开发、护理教育问答模型的优化以及跨语言护理知识库的构建。这些工作不仅扩展了数据集的应用范围，还进一步推动了人工智能在医疗教育中的深度整合，为未来护理教育技术的创新奠定了基础。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集