ekrombouts/dutch_nursing_home_notes
收藏Hugging Face2024-06-29 更新2024-07-06 收录
下载链接:
https://hf-mirror.com/datasets/ekrombouts/dutch_nursing_home_notes
下载链接
链接失效反馈官方服务:
资源简介:
该数据集之前名为dutch_nursing_home_records,为了与临床NLP社区更常用的术语保持一致,更名为dutch_nursing_home_notes。它包含为NLP实验生成的合成医疗数据,模仿了真实世界的护理院客户笔记,用于机器学习和数据分析。数据生成使用了OpenAI的3.5模型,并由经验丰富的老年病专家编写提示。数据集包含两列:报告和主题,主题分为多个类别。此外,还讨论了数据集的伦理问题,如偏见、隐私和局限性。
This dataset, named Dutch nursinghome care notes, contains synthetic healthcare data generated for NLP experiments. It mimics real-world client notes of nursing care homes for machine learning and data analysis. The dataset consists of two columns: report (textual nursing care reports) and topic (categorized into multiple care-related topics). The data generation used OpenAIs 3.5 model, with prompts written by an experienced geriatric specialist. Although the data is synthetic, ethical considerations such as potential biases, privacy issues, and data limitations should be noted.
提供机构:
ekrombouts
原始信息汇总
Dutch Nursing Home Care Notes 数据集
描述
该数据集之前名为 dutch_nursing_home_records,为了与临床自然语言处理(NLP)社区的常用术语保持一致,名称更改为 dutch_nursing_home_notes。该数据集包含用于NLP实验的合成医疗数据,模拟了护理之家的真实客户笔记,适用于机器学习和数据分析。
数据生成
数据生成脚本可在 GitHub 找到。生成过程使用 OpenAI 的 3.5 模型创建现实且匿名的数据集,提示由经验丰富的老年病专家编写。
数据集结构
数据集包含两列:
- report: 文本护理报告。
- topic: 分类为 ADL, eten_drinken, sociaal, huid, medisch_logistiek, nachten, onrust, symptomen, mobiliteit。
伦理考虑
尽管数据是合成的,但它旨在反映真实的护理之家场景。伦理考虑包括:
- 偏见: 数据生成过程可能引入训练模型或提示设计中的偏见。
- 隐私: 尽管数据是合成的,但它模拟了敏感的现实世界信息。使用时应谨慎,以避免任何滥用或误用。
- 局限性: 该数据集可能未涵盖护理之家护理的所有方面,不应作为医疗环境中决策的唯一资源。



