Stereotypes-in-LLMs/hiring-analyses-reasoning-uk
收藏Hugging Face2024-04-27 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Stereotypes-in-LLMs/hiring-analyses-reasoning-uk
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: candidate_id
dtype: string
- name: job_id
dtype: string
- name: CV
dtype: string
- name: Job Description
dtype: string
- name: Job Position
dtype: string
- name: lang
dtype: string
- name: protected_group
dtype: string
- name: protected_attr
dtype: string
- name: group_id
dtype: string
- name: decision
dtype: string
- name: feedback
dtype: string
- name: raw_ai_decision
dtype: string
splits:
- name: gender
num_bytes: 48597647
num_examples: 9000
- name: marital_status
num_bytes: 12228037
num_examples: 2250
- name: military_status
num_bytes: 12185419
num_examples: 2250
- name: religion
num_bytes: 21849311
num_examples: 4050
- name: name
num_bytes: 24317238
num_examples: 4500
- name: age
num_bytes: 14536539
num_examples: 2700
download_size: 11580329
dataset_size: 133714191
configs:
- config_name: default
data_files:
- split: gender
path: data/gender-*
- split: marital_status
path: data/marital_status-*
- split: military_status
path: data/military_status-*
- split: religion
path: data/religion-*
- split: name
path: data/name-*
- split: age
path: data/age-*
license: cc-by-4.0
---
数据集信息(dataset_info):
特征字段:
- 名称:求职者ID(candidate_id),数据类型:字符串
- 名称:岗位ID(job_id),数据类型:字符串
- 名称:简历(CV),数据类型:字符串
- 名称:岗位描述(Job Description),数据类型:字符串
- 名称:招聘职位(Job Position),数据类型:字符串
- 名称:语言(lang),数据类型:字符串
- 名称:受保护群体(protected_group),数据类型:字符串
- 名称:受保护属性(protected_attr),数据类型:字符串
- 名称:群体ID(group_id),数据类型:字符串
- 名称:招聘决策(decision),数据类型:字符串
- 名称:反馈信息(feedback),数据类型:字符串
- 名称:AI原始决策结果(raw_ai_decision),数据类型:字符串
数据集拆分:
- 拆分集名称:性别(gender),字节数:48597647,样本量:9000
- 拆分集名称:婚姻状况(marital_status),字节数:12228037,样本量:2250
- 拆分集名称:兵役状况(military_status),字节数:12185419,样本量:2250
- 拆分集名称:宗教信仰(religion),字节数:21849311,样本量:4050
- 拆分集名称:姓名(name),字节数:24317238,样本量:4500
- 拆分集名称:年龄(age),字节数:14536539,样本量:2700
下载大小:11580329字节
数据集总大小:133714191字节
配置项:
- 配置名称:默认配置(default),数据文件:
- 拆分集:性别(gender),对应路径:data/gender-*
- 拆分集:婚姻状况(marital_status),对应路径:data/marital_status-*
- 拆分集:兵役状况(military_status),对应路径:data/military_status-*
- 拆分集:宗教信仰(religion),对应路径:data/religion-*
- 拆分集:姓名(name),对应路径:data/name-*
- 拆分集:年龄(age),对应路径:data/age-*
开源许可协议:CC BY 4.0(知识共享署名4.0)
提供机构:
Stereotypes-in-LLMs
原始信息汇总
数据集概述
数据集特征
- candidate_id: 数据类型 - 字符串
- job_id: 数据类型 - 字符串
- CV: 数据类型 - 字符串
- Job Description: 数据类型 - 字符串
- Job Position: 数据类型 - 字符串
- lang: 数据类型 - 字符串
- protected_group: 数据类型 - 字符串
- protected_attr: 数据类型 - 字符串
- group_id: 数据类型 - 字符串
- decision: 数据类型 - 字符串
- feedback: 数据类型 - 字符串
- raw_ai_decision: 数据类型 - 字符串
数据集分割
- gender: 数据大小 - 48597647 字节, 样本数 - 9000
- marital_status: 数据大小 - 12228037 字节, 样本数 - 2250
- military_status: 数据大小 - 12185419 字节, 样本数 - 2250
- religion: 数据大小 - 21849311 字节, 样本数 - 4050
- name: 数据大小 - 24317238 字节, 样本数 - 4500
- age: 数据大小 - 14536539 字节, 样本数 - 2700
数据集大小
- 下载大小: 11580329 字节
- 数据集总大小: 133714191 字节
配置
- config_name: default
- data_files:
- split: gender, path: data/gender-*
- split: marital_status, path: data/marital_status-*
- split: military_status, path: data/military_status-*
- split: religion, path: data/religion-*
- split: name, path: data/name-*
- split: age, path: data/age-*
许可证
- cc-by-4.0



