elaine1wan/Reference-Letter-Bias-Prompts
收藏Hugging Face2024-03-15 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/elaine1wan/Reference-Letter-Bias-Prompts
下载链接
链接失效反馈官方服务:
资源简介:
Reference Letter Bias数据集由Wan等人于2023年创建,旨在研究大型语言模型(LLMs)在生成推荐信时的性别偏见。数据集分为Context-Less Generation (CLG)和Context-Based Generation (CBG)两部分,分别用于测试在没有背景信息和有背景信息的情况下LLMs生成的推荐信。CLG包含120个样本,CBG包含6028个样本。
Reference Letter Bias数据集由Wan等人于2023年创建,旨在研究大型语言模型(LLMs)在生成推荐信时的性别偏见。数据集分为Context-Less Generation (CLG)和Context-Based Generation (CBG)两部分,分别用于测试在没有背景信息和有背景信息的情况下LLMs生成的推荐信。CLG包含120个样本,CBG包含6028个样本。
提供机构:
elaine1wan
原始信息汇总
数据集概述
数据集名称
Reference Letter Bias Dataset
创建者与发布
由Wan et al., 2023创建,并根据MIT许可证发布。
目的
研究语言模型(LLMs)中的性别偏见,特别是在推荐信生成方面的表现。
研究内容
- 分析语言风格:包括正式性、积极性和代理性。
- 词汇内容:比较女性和男性推荐信中最突出的词汇。
数据集结构
- Context-Less Generation (CLG): 120样本(60男,60女),单列“prompt”。
- Context-Based Generation (CBG): 6028样本(3014男,3014女),包含两列“prompt”和“info”。
加载数据集
clg_dataset = load_dataset("Reference-Letter-Bias", split="clg") cbg_dataset = load_dataset("Reference-Letter-Bias", split="cbg")
数据集来源
- 仓库: https://github.com/uclanlp/biases-llm-reference-letters/tree/main/agency_classifier
- 论文: https://arxiv.org/abs/2310.09219



