five

elaine1wan/Reference-Letter-Bias-Prompts

收藏
Hugging Face2024-03-15 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/elaine1wan/Reference-Letter-Bias-Prompts
下载链接
链接失效反馈
官方服务:
资源简介:
Reference Letter Bias数据集由Wan等人于2023年创建,旨在研究大型语言模型(LLMs)在生成推荐信时的性别偏见。数据集分为Context-Less Generation (CLG)和Context-Based Generation (CBG)两部分,分别用于测试在没有背景信息和有背景信息的情况下LLMs生成的推荐信。CLG包含120个样本,CBG包含6028个样本。

Reference Letter Bias数据集由Wan等人于2023年创建,旨在研究大型语言模型(LLMs)在生成推荐信时的性别偏见。数据集分为Context-Less Generation (CLG)和Context-Based Generation (CBG)两部分,分别用于测试在没有背景信息和有背景信息的情况下LLMs生成的推荐信。CLG包含120个样本,CBG包含6028个样本。
提供机构:
elaine1wan
原始信息汇总

数据集概述

数据集名称

Reference Letter Bias Dataset

创建者与发布

由Wan et al., 2023创建,并根据MIT许可证发布。

目的

研究语言模型(LLMs)中的性别偏见,特别是在推荐信生成方面的表现。

研究内容

  • 分析语言风格:包括正式性、积极性和代理性。
  • 词汇内容:比较女性和男性推荐信中最突出的词汇。

数据集结构

  • Context-Less Generation (CLG): 120样本(60男,60女),单列“prompt”。
  • Context-Based Generation (CBG): 6028样本(3014男,3014女),包含两列“prompt”和“info”。

加载数据集

clg_dataset = load_dataset("Reference-Letter-Bias", split="clg") cbg_dataset = load_dataset("Reference-Letter-Bias", split="cbg")

数据集来源

  • 仓库: https://github.com/uclanlp/biases-llm-reference-letters/tree/main/agency_classifier
  • 论文: https://arxiv.org/abs/2310.09219
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作