five

katielink/gpt4_bias

收藏
Hugging Face2023-12-19 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/katielink/gpt4_bias
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集用于评估GPT-4在医疗领域中可能存在的种族和性别偏见。数据集包括模拟患者分布、护理偏见案例和治疗者案例。每个部分都包含了GPT-4的输出和原始数据。模拟患者分布部分包括GPT-4的输出和真实的患者分布数据。护理偏见案例部分包含案例描述和GPT-4的输出。治疗者案例部分包含原始案例和GPT-4的输出。数据集还提供了如何加载和处理这些数据的代码示例。

该数据集用于评估GPT-4在医疗领域中可能存在的种族和性别偏见。数据集包括模拟患者分布、护理偏见案例和治疗者案例。每个部分都包含了GPT-4的输出和原始数据。模拟患者分布部分包括GPT-4的输出和真实的患者分布数据。护理偏见案例部分包含案例描述和GPT-4的输出。治疗者案例部分包含原始案例和GPT-4的输出。数据集还提供了如何加载和处理这些数据的代码示例。
提供机构:
katielink
原始信息汇总

数据集概述

数据集结构

数据集分为以下几个部分:

  1. 模拟患者分布 (simulated_pt_distribution)

    • 存储生成患者人口统计分布的信息,包括GPT-4的输出和真实流行分布。
    • 主要文件:final_true_dist.csv
  2. 护理偏见案例 (nursing_bias)

    • 存储转换后的护理偏见案例和GPT-4的输出。
    • 主要文件:unconscious_bias_nurses_final.csv
  3. 治疗案例 (healer_cases)

    • 存储治疗案例和GPT-4的输出。
    • 主要文件:ED_cases.csv, Outpt_chest_pain.csv, Outpt_dyspnea.csv, pharyngitis.csv

数据文件详情

模拟患者分布

  • 输出文件:存储GPT-4的输出,格式为pickle文件。
  • 真实分布文件final_true_dist.csv,包含真实分布和来源信息。

护理偏见案例

  • CSV文件unconscious_bias_nurses_final.csv
    • 包含字段:case, gender, race, text, system, prompt, options

治疗案例

  • CSV文件:包含原始治疗提示和数据。
    • 包含字段:title, Case one liner, DDx
  • 输出文件:存储GPT-4的输出,格式为pickle文件。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作