ibm-hr-analytics-attrition-dataset|人力资源分析数据集|员工流失预测数据集
收藏数据集概述
数据集名称
- 名称: IBM HR Analytics Employee Attrition & Performance
数据集目的
- 目的: 预测员工流失情况,帮助HR部门及时干预以减少员工流失。
数据集内容
- 数据量: 约1500条记录
- 数据类型: 员工调查数据,包括是否存在员工流失。
数据集特征
- 教育水平: 1 Below College 2 College 3 Bachelor 4 Master 5 Doctor
- 环境满意度: 1 Low 2 Medium 3 High 4 Very High
- 工作参与度: 1 Low 2 Medium 3 High 4 Very High
- 工作满意度: 1 Low 2 Medium 3 High 4 Very High
- 绩效评级: 1 Low 2 Good 3 Excellent 4 Outstanding
- 关系满意度: 1 Low 2 Medium 3 High 4 Very High
- 工作生活平衡: 1 Bad 2 Good 3 Better 4 Best
数据集应用
- 应用场景: 用于开发分类模型,预测员工流失风险,辅助HR进行针对性干预。
数据集局限性
- 局限性: 由于数据集规模有限,模型预测效果可能仅提供适度的改进。
未来发展
- 未来方向: 计划使用更大规模的数据集进行员工细分,识别“高风险”员工类别,以获取更深入的洞察。

中国农村金融统计数据
该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。
www.pbc.gov.cn 收录
CatMeows
该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。
huggingface 收录
中国区域教育数据库
该数据集包含了中国各区域的教育统计数据,涵盖了学校数量、学生人数、教师资源、教育经费等多个方面的信息。
www.moe.gov.cn 收录
CliMedBench
CliMedBench是一个大规模的中文医疗大语言模型评估基准,由华东师范大学等机构创建。该数据集包含33,735个问题,涵盖14个核心临床场景,主要来源于顶级三级医院的真实电子健康记录和考试练习。数据集的创建过程包括专家指导的数据选择和多轮质量控制,确保数据的真实性和可靠性。CliMedBench旨在评估和提升医疗大语言模型在临床决策支持、诊断和治疗建议等方面的能力,解决医疗领域中模型性能评估的不足问题。
arXiv 收录
VisDrone2019
VisDrone2019数据集由AISKYEYE团队在天津大学机器学习和数据挖掘实验室收集,包含288个视频片段共261,908帧和10,209张静态图像。数据集覆盖了中国14个不同城市的城市和乡村环境,包括行人、车辆、自行车等多种目标,以及稀疏和拥挤场景。数据集使用不同型号的无人机在各种天气和光照条件下收集,手动标注了超过260万个目标边界框,并提供了场景可见性、对象类别和遮挡等重要属性。
github 收录