ibm-hr-analytics-attrition-dataset|人力资源分析数据集|员工流失预测数据集
收藏数据集概述
数据集名称
- 名称: IBM HR Analytics Employee Attrition & Performance
数据集目的
- 目的: 预测员工流失情况,帮助HR部门及时干预以减少员工流失。
数据集内容
- 数据量: 约1500条记录
- 数据类型: 员工调查数据,包括是否存在员工流失。
数据集特征
- 教育水平: 1 Below College 2 College 3 Bachelor 4 Master 5 Doctor
- 环境满意度: 1 Low 2 Medium 3 High 4 Very High
- 工作参与度: 1 Low 2 Medium 3 High 4 Very High
- 工作满意度: 1 Low 2 Medium 3 High 4 Very High
- 绩效评级: 1 Low 2 Good 3 Excellent 4 Outstanding
- 关系满意度: 1 Low 2 Medium 3 High 4 Very High
- 工作生活平衡: 1 Bad 2 Good 3 Better 4 Best
数据集应用
- 应用场景: 用于开发分类模型,预测员工流失风险,辅助HR进行针对性干预。
数据集局限性
- 局限性: 由于数据集规模有限,模型预测效果可能仅提供适度的改进。
未来发展
- 未来方向: 计划使用更大规模的数据集进行员工细分,识别“高风险”员工类别,以获取更深入的洞察。

Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录
LIDC-IDRI
LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。
OpenDataLab 收录
GLUCOBENCH
GLUCOBENCH是由德克萨斯A&M大学统计系和电气与计算机工程系共同创建的一个综合数据集,旨在为连续血糖监测(CGM)数据的预测模型提供标准化的评估平台。该数据集包含五个公开的CGM数据集,涵盖不同规模和人口特征,数据量从5个到超过200个患者不等。数据集的创建过程包括数据预处理、插值和分割,确保数据质量。GLUCOBENCH主要应用于糖尿病管理领域,旨在通过提高血糖轨迹预测的准确性和不确定性量化,改善糖尿病患者的治疗效果和自主管理能力。
arXiv 收录
BatteryLife
BatteryLife数据集是由香港科技大学(广州)等机构提出的一个全面电池寿命预测数据集。该数据集整合了16个数据集,包含超过90,000个样本,是迄今为止最大的电池寿命数据集。它提供了包括锂离子、锌离子和钠离子电池在内的多种类型电池,覆盖了8种格式、80种化学系统、12种操作温度和646种充放电协议,具有前所未有的多样性。该数据集既包括实验室测试数据,也包括工业测试数据,为电池寿命预测研究提供了丰富的资源。
arXiv 收录
MNBVC
MNBVC数据集是一个超大规模的中文语料集,包括新闻、作文、小说、书籍、杂志、论文、台词、帖子、wiki、古诗、歌词、商品介绍、笑话、糗事、聊天记录等一切形式的纯文本中文数据。数据集不但包括主流文化,也包括各个小众文化甚至火星文的数据。
github 收录
