HR Data
收藏github2024-10-26 更新2024-10-27 收录
下载链接:
https://github.com/Atchayamangai/HR_Employee_Distribution_Report
下载链接
链接失效反馈官方服务:
资源简介:
包含22000多行数据的HR数据集,时间跨度从2000年到2020年。数据集用于分析公司员工的性别、种族、年龄、工作地点、雇佣时长、部门和职位分布等问题。
An HR dataset with over 22,000 rows of data, covering the time span from 2000 to 2020. This dataset is designed for analyzing the distribution of company employees across multiple dimensions including gender, race, age, work location, tenure, department and job position.
创建时间:
2024-10-25
原始信息汇总
HR Employee Distribution Report Dashboard
数据使用
- 数据:包含22000多行的人力资源数据,时间范围从2000年到2020年。
- 数据清洗与分析:使用MySQL和Jupyter Notebook(sql magic)进行数据清洗和分析。
- 数据可视化:使用PowerBI进行数据可视化。
问题
- 公司员工的性别分布情况如何?
- 公司员工的种族/民族分布情况如何?
- 公司员工的年龄分布情况如何?
- 员工在总部工作与远程工作的分布情况如何?
- 被终止雇佣的员工的平均雇佣时长是多少?
- 性别分布在不同部门和职位中的变化情况如何?
- 公司内职位的分布情况如何?
- 哪个部门的离职率最高?
- 员工在各州的地理分布情况如何?
- 基于雇佣和终止日期,公司员工数量随时间的变化情况如何?
- 每个部门的任期分布情况如何?
发现总结
- 男性员工数量较多。
- 白人种族占主导地位,而夏威夷原住民和美国印第安人最少。
- 最年轻的员工22岁,最年长的员工59岁。
- 创建了5个年龄组(18-24, 25-34, 35-44, 45-54, 55-64),其中35-44岁组员工数量最多,18-24岁组最少。
- 大部分员工在总部工作,远程工作员工较少。
- 被终止雇佣的员工的平均雇佣时长约为8年。
- 性别分布在各部门中相对平衡,但总体上男性员工多于女性员工。
- 审计部门的离职率最高,市场营销和业务发展部门的离职率最低。
- 大部分员工来自俄亥俄州。
- 员工数量逐年增加。
- 各部门的平均任期约为9年,销售部门任期最长,法律、支持、产品管理部门任期最短。
局限性
- 部分记录包含负年龄,这些记录在查询时被排除(967条记录)。使用的年龄为18岁及以上。
- 部分终止日期在未来,这些记录未被包含在分析中(1599条记录)。仅使用小于或等于当前日期的终止日期。
搜集汇总
数据集介绍

构建方式
HR Data数据集的构建基于从2000年至2020年间收集的超过22000条员工记录。数据清洗与分析主要通过MySQL数据库和Jupyter Notebook中的SQL Magic功能完成,确保数据的质量与一致性。数据可视化则借助PowerBI工具,以图表形式呈现复杂的员工分布信息。
使用方法
使用HR Data数据集时,用户可以通过MySQL或Jupyter Notebook进行数据查询和初步分析,利用PowerBI进行高级数据可视化。数据集支持多种分析需求,如性别和种族的员工分布、年龄段分析、部门间员工流动率等。用户可根据具体研究目标,选择合适的数据处理和分析工具,以获取深入的洞察和结论。
背景与挑战
背景概述
HR Data数据集由Atchayamangai创建,涵盖了2000年至2020年间超过22000条员工记录。该数据集主要用于人力资源管理领域的研究,旨在通过分析员工的性别、种族、年龄、工作地点、雇佣时长、部门分布等关键指标,揭示公司内部的人力资源结构和动态变化。这一数据集的创建为研究者提供了一个详尽的视角,以探讨人力资源管理中的多样性和公平性问题,同时也为公司决策提供了数据支持。
当前挑战
HR Data数据集在构建过程中面临了若干挑战。首先,数据清洗过程中发现部分记录存在负年龄值和未来离职日期,这些异常数据被排除在外,影响了数据的完整性。其次,数据分析涉及多个维度,如性别、种族、年龄等,如何确保这些维度的平衡分析和准确性是一个重要挑战。此外,数据的可视化展示需要考虑如何有效地传达复杂的人力资源分布信息,以便决策者能够迅速理解并采取相应措施。
常用场景
经典使用场景
在人力资源管理领域,HR Data数据集被广泛应用于员工分布和离职分析。通过该数据集,研究者可以深入探讨公司内部的性别、种族、年龄、部门和地理位置等多维度员工分布情况。例如,分析性别在不同部门和职位中的分布,有助于揭示潜在的性别不平等现象;而研究员工年龄分布和离职率,则能为公司提供优化人力资源策略的依据。
解决学术问题
HR Data数据集为学术界提供了丰富的实证数据,解决了人力资源管理中的多个关键问题。例如,通过分析性别和种族在公司内部的分布,研究者可以探讨职场中的性别和种族多样性问题,进而提出促进平等就业的策略。此外,数据集中的离职率和雇佣历史数据,为研究员工流动性和组织稳定性提供了宝贵的实证支持,有助于构建更精确的员工流动模型。
实际应用
在实际应用中,HR Data数据集被企业广泛用于优化人力资源管理策略。通过分析员工的性别、年龄和部门分布,企业可以制定更具针对性的招聘和培训计划,提升员工的满意度和留任率。此外,数据集中的离职率和雇佣历史数据,帮助企业识别高流动率部门,从而采取措施改善工作环境和福利待遇,增强员工的归属感和忠诚度。
数据集最近研究
最新研究方向
在人力资源管理领域,HR Data数据集的最新研究方向主要集中在员工多样性和离职率分析上。随着企业对多元化和包容性的重视,研究者们正利用该数据集深入探讨性别、种族和年龄在不同部门和工作岗位上的分布情况,以及这些因素如何影响员工的离职率。此外,数据集还为研究员工的工作年限和部门流动率提供了宝贵信息,有助于企业优化人力资源策略,提升员工满意度和留存率。
以上内容由遇见数据集搜集并总结生成



