elaine1wan/Reference-Letter-Bias-Prompts

Name: elaine1wan/Reference-Letter-Bias-Prompts
Creator: elaine1wan
Published: 2024-03-15 20:29:22
License: 暂无描述

Hugging Face2024-03-15 更新2024-06-11 收录

下载链接：

https://hf-mirror.com/datasets/elaine1wan/Reference-Letter-Bias-Prompts

下载链接

链接失效反馈

官方服务：

资源简介：

Reference Letter Bias数据集由Wan等人于2023年创建，旨在研究大型语言模型（LLMs）在生成推荐信时的性别偏见。数据集分为Context-Less Generation (CLG)和Context-Based Generation (CBG)两部分，分别用于测试在没有背景信息和有背景信息的情况下LLMs生成的推荐信。CLG包含120个样本，CBG包含6028个样本。

提供机构：

elaine1wan

原始信息汇总

数据集概述

数据集名称

Reference Letter Bias Dataset

创建者与发布

由Wan et al., 2023创建，并根据MIT许可证发布。

目的

研究语言模型（LLMs）中的性别偏见，特别是在推荐信生成方面的表现。

研究内容

分析语言风格：包括正式性、积极性和代理性。
词汇内容：比较女性和男性推荐信中最突出的词汇。

数据集结构

Context-Less Generation (CLG): 120样本（60男，60女），单列“prompt”。
Context-Based Generation (CBG): 6028样本（3014男，3014女），包含两列“prompt”和“info”。

加载数据集

clg_dataset = load_dataset("Reference-Letter-Bias", split="clg") cbg_dataset = load_dataset("Reference-Letter-Bias", split="cbg")

数据集来源

仓库: https://github.com/uclanlp/biases-llm-reference-letters/tree/main/agency_classifier
论文: https://arxiv.org/abs/2310.09219

5,000+

优质数据集

54 个

任务类型

进入经典数据集