five

Stereotypes-in-LLMs/hiring-analyses-reasoning-uk

收藏
Hugging Face2024-04-27 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Stereotypes-in-LLMs/hiring-analyses-reasoning-uk
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: candidate_id dtype: string - name: job_id dtype: string - name: CV dtype: string - name: Job Description dtype: string - name: Job Position dtype: string - name: lang dtype: string - name: protected_group dtype: string - name: protected_attr dtype: string - name: group_id dtype: string - name: decision dtype: string - name: feedback dtype: string - name: raw_ai_decision dtype: string splits: - name: gender num_bytes: 48597647 num_examples: 9000 - name: marital_status num_bytes: 12228037 num_examples: 2250 - name: military_status num_bytes: 12185419 num_examples: 2250 - name: religion num_bytes: 21849311 num_examples: 4050 - name: name num_bytes: 24317238 num_examples: 4500 - name: age num_bytes: 14536539 num_examples: 2700 download_size: 11580329 dataset_size: 133714191 configs: - config_name: default data_files: - split: gender path: data/gender-* - split: marital_status path: data/marital_status-* - split: military_status path: data/military_status-* - split: religion path: data/religion-* - split: name path: data/name-* - split: age path: data/age-* license: cc-by-4.0 ---

数据集信息(dataset_info): 特征字段: - 名称:求职者ID(candidate_id),数据类型:字符串 - 名称:岗位ID(job_id),数据类型:字符串 - 名称:简历(CV),数据类型:字符串 - 名称:岗位描述(Job Description),数据类型:字符串 - 名称:招聘职位(Job Position),数据类型:字符串 - 名称:语言(lang),数据类型:字符串 - 名称:受保护群体(protected_group),数据类型:字符串 - 名称:受保护属性(protected_attr),数据类型:字符串 - 名称:群体ID(group_id),数据类型:字符串 - 名称:招聘决策(decision),数据类型:字符串 - 名称:反馈信息(feedback),数据类型:字符串 - 名称:AI原始决策结果(raw_ai_decision),数据类型:字符串 数据集拆分: - 拆分集名称:性别(gender),字节数:48597647,样本量:9000 - 拆分集名称:婚姻状况(marital_status),字节数:12228037,样本量:2250 - 拆分集名称:兵役状况(military_status),字节数:12185419,样本量:2250 - 拆分集名称:宗教信仰(religion),字节数:21849311,样本量:4050 - 拆分集名称:姓名(name),字节数:24317238,样本量:4500 - 拆分集名称:年龄(age),字节数:14536539,样本量:2700 下载大小:11580329字节 数据集总大小:133714191字节 配置项: - 配置名称:默认配置(default),数据文件: - 拆分集:性别(gender),对应路径:data/gender-* - 拆分集:婚姻状况(marital_status),对应路径:data/marital_status-* - 拆分集:兵役状况(military_status),对应路径:data/military_status-* - 拆分集:宗教信仰(religion),对应路径:data/religion-* - 拆分集:姓名(name),对应路径:data/name-* - 拆分集:年龄(age),对应路径:data/age-* 开源许可协议:CC BY 4.0(知识共享署名4.0)
提供机构:
Stereotypes-in-LLMs
原始信息汇总

数据集概述

数据集特征

  • candidate_id: 数据类型 - 字符串
  • job_id: 数据类型 - 字符串
  • CV: 数据类型 - 字符串
  • Job Description: 数据类型 - 字符串
  • Job Position: 数据类型 - 字符串
  • lang: 数据类型 - 字符串
  • protected_group: 数据类型 - 字符串
  • protected_attr: 数据类型 - 字符串
  • group_id: 数据类型 - 字符串
  • decision: 数据类型 - 字符串
  • feedback: 数据类型 - 字符串
  • raw_ai_decision: 数据类型 - 字符串

数据集分割

  • gender: 数据大小 - 48597647 字节, 样本数 - 9000
  • marital_status: 数据大小 - 12228037 字节, 样本数 - 2250
  • military_status: 数据大小 - 12185419 字节, 样本数 - 2250
  • religion: 数据大小 - 21849311 字节, 样本数 - 4050
  • name: 数据大小 - 24317238 字节, 样本数 - 4500
  • age: 数据大小 - 14536539 字节, 样本数 - 2700

数据集大小

  • 下载大小: 11580329 字节
  • 数据集总大小: 133714191 字节

配置

  • config_name: default
  • data_files:
    • split: gender, path: data/gender-*
    • split: marital_status, path: data/marital_status-*
    • split: military_status, path: data/military_status-*
    • split: religion, path: data/religion-*
    • split: name, path: data/name-*
    • split: age, path: data/age-*

许可证

  • cc-by-4.0
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作