Hiring Decision Analysis Dataset|招聘决策数据集|数据分析数据集
收藏招聘决策分析数据集
数据描述
数据集包含以下列:
变量描述
-
年龄:
- 数据范围:20至50岁
- 数据类型:整数
-
性别:
- 分类:男性(0)或女性(1)
- 数据类型:二元
-
教育水平:
- 分类:1: 学士(类型1),2: 学士(类型2),3: 硕士,4: 博士
- 数据类型:分类
-
工作经验年数:
- 数据范围:0至15年
- 数据类型:整数
-
之前工作过的公司数:
- 数据范围:1至5家公司
- 数据类型:整数
-
与公司的距离:
- 数据范围:1至50公里
- 数据类型:浮点数(连续)
-
面试分数:
- 数据范围:0至100
- 数据类型:整数
-
技能分数:
- 数据范围:0至100
- 数据类型:整数
-
个性分数:
- 数据范围:0至100
- 数据类型:整数
-
招聘策略:
- 分类:1: 激进,2: 中等,3: 保守
- 数据类型:分类
-
招聘决策(目标变量):
- 分类:0: 未录用,1: 录用
- 数据类型:二元(整数)
探索性数据分析(EDA)
相关性分析
通过相关性分析,识别特征与目标变量(招聘决策)之间的关系,了解哪些因素在招聘过程中最具影响力。
年龄与招聘决策
分析年龄分布及其对招聘决策的影响,揭示招聘过程中的年龄相关趋势和偏见。使用直方图和箱线图研究不同年龄段。
工作经验年数与招聘决策
探索工作经验年数与被录用可能性的关系。使用散点图和折线图来可视化这种关系。
预测建模
逻辑回归
使用逻辑回归模型预测招聘决策。逻辑回归模型适用于此类二分类问题,目标变量(招聘决策)有两种可能结果:录用或未录用。
超参数调优
使用GridSearchCV进行超参数调优以优化模型。调优的参数包括正则化惩罚(penalty
:l1
, l2
)和正则化强度(C
:[0.01, 0.1, 1, 10, 100]
)。

URPC系列数据集, S-URPC2019, UDD
URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。
github 收录
Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录
HazyDet
HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。
arXiv 收录
Traditional-Chinese-Medicine-Dataset-SFT
该数据集是一个高质量的中医数据集,主要由非网络来源的内部数据构成,包含约1GB的中医各个领域临床案例、名家典籍、医学百科、名词解释等优质内容。数据集99%为简体中文内容,质量优异,信息密度可观。数据集适用于预训练或继续预训练用途,未来将继续发布针对SFT/IFT的多轮对话和问答数据集。数据集可以独立使用,但建议先使用配套的预训练数据集对模型进行继续预训练后,再使用该数据集进行进一步的指令微调。数据集还包含一定比例的中文常识、中文多轮对话数据以及古文/文言文<->现代文翻译数据,以避免灾难性遗忘并加强模型表现。
huggingface 收录
CMU-MOSEI
CMU Multimodal Opinion Sentiment and Emotion Intensity (CMU-MOSEI) is the largest dataset of sentence-level sentiment analysis and emotion recognition in online videos. CMU-MOSEI contains over 12 hours of annotated video from over 1000 speakers and 250 topics.
Papers with Code 收录