katielink/gpt4_bias
收藏Hugging Face2023-12-19 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/katielink/gpt4_bias
下载链接
链接失效反馈官方服务:
资源简介:
该数据集用于评估GPT-4在医疗领域中可能存在的种族和性别偏见。数据集包括模拟患者分布、护理偏见案例和治疗者案例。每个部分都包含了GPT-4的输出和原始数据。模拟患者分布部分包括GPT-4的输出和真实的患者分布数据。护理偏见案例部分包含案例描述和GPT-4的输出。治疗者案例部分包含原始案例和GPT-4的输出。数据集还提供了如何加载和处理这些数据的代码示例。
该数据集用于评估GPT-4在医疗领域中可能存在的种族和性别偏见。数据集包括模拟患者分布、护理偏见案例和治疗者案例。每个部分都包含了GPT-4的输出和原始数据。模拟患者分布部分包括GPT-4的输出和真实的患者分布数据。护理偏见案例部分包含案例描述和GPT-4的输出。治疗者案例部分包含原始案例和GPT-4的输出。数据集还提供了如何加载和处理这些数据的代码示例。
提供机构:
katielink
原始信息汇总
数据集概述
数据集结构
数据集分为以下几个部分:
-
模拟患者分布 (
simulated_pt_distribution)- 存储生成患者人口统计分布的信息,包括GPT-4的输出和真实流行分布。
- 主要文件:
final_true_dist.csv
-
护理偏见案例 (
nursing_bias)- 存储转换后的护理偏见案例和GPT-4的输出。
- 主要文件:
unconscious_bias_nurses_final.csv
-
治疗案例 (
healer_cases)- 存储治疗案例和GPT-4的输出。
- 主要文件:
ED_cases.csv,Outpt_chest_pain.csv,Outpt_dyspnea.csv,pharyngitis.csv
数据文件详情
模拟患者分布
- 输出文件:存储GPT-4的输出,格式为pickle文件。
- 真实分布文件:
final_true_dist.csv,包含真实分布和来源信息。
护理偏见案例
- CSV文件:
unconscious_bias_nurses_final.csv- 包含字段:
case,gender,race,text,system,prompt,options
- 包含字段:
治疗案例
- CSV文件:包含原始治疗提示和数据。
- 包含字段:
title,Case one liner,DDx
- 包含字段:
- 输出文件:存储GPT-4的输出,格式为pickle文件。



