five

jasonhwan/iCliniq500-pdbd-race

收藏
Hugging Face2024-11-27 更新2024-12-14 收录
下载链接:
https://hf-mirror.com/datasets/jasonhwan/iCliniq500-pdbd-race
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是Persona-Aware Bias Evaluation (PABE)框架在医疗问答领域的一个小规模概念验证。数据集基于iCliniq-10K数据集,包含真实患者与医生的对话。通过对500条对话应用PABE框架,生成了2000条数据,每条数据包含原始输入、目标输出、增强后的输入和用于增强的人物属性。数据集旨在评估和减轻大型语言模型(LLM)中的偏见,特别是通过零样本文本风格转换和人物提示来隐式编码受保护属性信息。

This dataset is a small proof of concept (PoC) of the Persona-Aware Bias Evaluation (PABE) framework applied in the medical QA domain. The dataset is based on the iCliniq-10K dataset, which contains real-life patient-physician conversations. By applying the PABE framework to 500 conversations, a 2000-row dataset was generated, with each row containing the original input, target output, augmented input, and the persona attribute used for augmentation. The dataset aims to evaluate and mitigate bias in large language models (LLMs), particularly by implicitly encoding protected attribute information through zero-shot text style transfer and persona prompting.
提供机构:
jasonhwan
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作