HR_Analytics.csv|人力资源分析数据集|员工流失数据集
收藏HR Analytics and Clustering 数据集概述
数据集来源
- 数据集来自 Kaggle,链接为:https://www.kaggle.com/datasets/anshika2301/hr-analytics-dataset
数据集描述
- 数据集包含2023年某大型公司员工的相关信息,用于分析员工流失率。
- 数据集文件名为
HR_Analytics.csv
,包含1480条记录和38个特征。
特征列表
EmpID
: 员工IDAge
: 年龄AgeGroup
: 年龄组Attrition
: 是否离职BusinessTravel
: 商务旅行频率DailyRate
: 日薪Department
: 部门DistanceFromHome
: 家到公司的距离Education
: 教育水平EducationField
: 教育领域EmployeeCount
: 员工数量EmployeeNumber
: 员工编号EnvironmentSatisfaction
: 环境满意度Gender
: 性别HourlyRate
: 小时工资JobInvolvement
: 工作参与度JobLevel
: 职位级别JobRole
: 职位JobSatisfaction
: 工作满意度MaritalStatus
: 婚姻状况MonthlyIncome
: 月收入SalarySlab
: 薪资等级MonthlyRate
: 月薪NumCompaniesWorked
: 工作过的公司数量Over18
: 是否超过18岁OverTime
: 是否加班PercentSalaryHike
: 薪资涨幅百分比PerformanceRating
: 绩效评级RelationshipSatisfaction
: 关系满意度StandardHours
: 标准工作小时StockOptionLevel
: 股票期权等级TotalWorkingYears
: 总工作年限TrainingTimesLastYear
: 去年培训次数WorkLifeBalance
: 工作与生活平衡YearsAtCompany
: 在公司工作年限YearsInCurrentRole
: 在当前职位工作年限YearsSinceLastPromotion
: 上次晋升后的年限YearsWithCurrManager
: 与当前经理共事年限
数据集目标
- 分析员工流失率是否异常,并识别相关模式。
- 提出并验证可能导致异常流失率的假设。
- 将员工分类为不同的群组,以提出定制化的解决方案。
数据处理步骤
- 加载数据
- 数据描述
- 数据预处理:清洗、探索性数据分析和特征工程
- 训练-测试数据集分割
- 机器学习模型构建
- 模型性能评估
- 模型部署
- 结论
数据集统计信息
- 数据集包含1480条记录,38个特征。
- 特征类型包括:1个浮点数类型,25个整数类型,12个对象类型。
- 数据集的基本统计信息包括:年龄、日薪、家到公司的距离、教育水平、月收入等特征的均值、标准差、最小值、最大值等。

LFW
人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download
AI_Studio 收录
Yahoo Finance
Dataset About finance related to stock market
kaggle 收录
典型分布式光伏出力预测数据集
光伏电站出力数据每5分钟从电站机房监控系统获取;气象实测数据从气象站获取,气象站建于电站30号箱变附近,每5分钟将采集的数据通过光纤传输到机房;数值天气预报数据利用中国电科院新能源气象应用机房的WRF业务系统(包括30TF计算刀片机、250TB并行存储)进行中尺度模式计算后输出预报产品,每日8点前通过反向隔离装置推送到电站内网预测系统。
国家基础学科公共科学数据中心 收录
China Groundgroundwater Monitoring Network
该数据集包含中国地下水监测网络的数据,涵盖了全国范围内的地下水位、水质和相关环境参数的监测信息。数据包括但不限于监测站点位置、监测时间、水位深度、水质指标(如pH值、溶解氧、总硬度等)以及环境因素(如气温、降水量等)。
www.ngac.org.cn 收录
koen430/relevant_selected_stock_news
该数据集包含通过GPT-3.5-turbo筛选出的新闻文章,旨在用于微调大型语言模型,以预测新闻发布后的股票价格变动。数据集包括多个特征,如股票代码、提示、文本、URL、结果、相关性、令牌计数等,并分为训练集、验证集和测试集。
hugging_face 收录