Stereotypes-in-LLMs/hiring-analyses-recruiter_guidelines-uk
收藏Hugging Face2024-04-27 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Stereotypes-in-LLMs/hiring-analyses-recruiter_guidelines-uk
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: candidate_id
dtype: string
- name: job_id
dtype: string
- name: CV
dtype: string
- name: Job Description
dtype: string
- name: Job Position
dtype: string
- name: lang
dtype: string
- name: protected_group
dtype: string
- name: protected_attr
dtype: string
- name: group_id
dtype: string
- name: decision
dtype: string
- name: feedback
dtype: string
- name: raw_ai_decision
dtype: string
splits:
- name: gender
num_bytes: 45350556
num_examples: 9000
- name: marital_status
num_bytes: 11416640
num_examples: 2250
- name: military_status
num_bytes: 11365088
num_examples: 2250
- name: religion
num_bytes: 20363184
num_examples: 4050
- name: name
num_bytes: 22704410
num_examples: 4500
- name: age
num_bytes: 13551632
num_examples: 2700
download_size: 8152662
dataset_size: 124751510
configs:
- config_name: default
data_files:
- split: gender
path: data/gender-*
- split: marital_status
path: data/marital_status-*
- split: military_status
path: data/military_status-*
- split: religion
path: data/religion-*
- split: name
path: data/name-*
- split: age
path: data/age-*
license: cc-by-4.0
---
提供机构:
Stereotypes-in-LLMs
原始信息汇总
数据集概述
数据集特征
- candidate_id: 数据类型 - string
- job_id: 数据类型 - string
- CV: 数据类型 - string
- Job Description: 数据类型 - string
- Job Position: 数据类型 - string
- lang: 数据类型 - string
- protected_group: 数据类型 - string
- protected_attr: 数据类型 - string
- group_id: 数据类型 - string
- decision: 数据类型 - string
- feedback: 数据类型 - string
- raw_ai_decision: 数据类型 - string
数据集分割
- gender: 数据大小 - 45350556 bytes, 样本数 - 9000
- marital_status: 数据大小 - 11416640 bytes, 样本数 - 2250
- military_status: 数据大小 - 11365088 bytes, 样本数 - 2250
- religion: 数据大小 - 20363184 bytes, 样本数 - 4050
- name: 数据大小 - 22704410 bytes, 样本数 - 4500
- age: 数据大小 - 13551632 bytes, 样本数 - 2700
数据集大小
- 下载大小: 8152662 bytes
- 数据集总大小: 124751510 bytes
配置文件
- config_name: default
- data_files:
- split: gender, path: data/gender-*
- split: marital_status, path: data/marital_status-*
- split: military_status, path: data/military_status-*
- split: religion, path: data/religion-*
- split: name, path: data/name-*
- split: age, path: data/age-*
许可证
- license: cc-by-4.0
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集名为'Stereotypes-in-LLMs/hiring-analyses-recruiter_guidelines-uk',主要用于研究大型语言模型在招聘过程中的偏见,特别是针对性别、婚姻状况、兵役状况、宗教、姓名和年龄等受保护属性的决策分析。数据集包含12个字段,分为6个部分,总样本量超过22,000个,覆盖多种受保护群体,旨在评估AI在招聘场景中的公平性和潜在刻板印象。
以上内容由遇见数据集搜集并总结生成



