Krooz/Campus_Recruitment_CSV
收藏Hugging Face2024-02-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Krooz/Campus_Recruitment_CSV
下载链接
链接失效反馈官方服务:
资源简介:
---
license: cc0-1.0
task_categories:
- text-classification
language:
- en
tags:
- education
size_categories:
- 1K<n<10K
---
## Dataset Description
This data set consists of Placement data of students in a XYZ campus. Based on the student's performance data we are classifying his Placement Status.
The students report includes the following information:
* CGPA - The grade of the student in his university
* Internships - The no of internship done by the student before final placement
* Projects - The no of projects done by the student
* Workshops/Certifications - The no of workshops attended and the certifications student had
* AptitudeTestScore - The aptitude score the student attained from the exam
* SoftSkillsRating - The soft skill rating attained by the student
* ExtracurricularActivities - Did the student has some extra curricular activities
* PlacementTraining - Did the student got placement training
* SSC_Marks - The senior secondary school marks scored by the student
* HSC_Marks - The higher secondary school marks scored by the student
* PlacementStatus - The label whether the student is Placed or not
## Usecases
- The data can be used to analyse various features of the data and determine which contributes more for the placement success
- The classification model can be build on top of the data to infer for a new students record the placement probability
# Variants
The same data is also available in a [Text format](https://huggingface.co/datasets/Krooz/Campus_Recruitment_Text) which is useful for finetuning an LLM.
PS: Do give a like if you found the dataset useful :)
许可证:CC0 1.0
任务类别:
- 文本分类(text-classification)
语言:
- 英语(en)
标签:
- 教育(education)
样本规模区间:
- 1000 < 样本数量 < 10000
## 数据集描述
本数据集收录了某XYZ校园的学生就业相关数据,旨在基于学生的各项学业与实践表现数据,对其最终就业状态进行分类。
学生数据集包含以下字段:
* CGPA:学生在校平均绩点(CGPA)
* 实习经历:学生正式就业前完成的实习总次数
* 项目经历:学生在校期间完成的项目总数量
* 工坊/认证经历:学生参与的工坊活动数量与取得的认证总数
* 能力倾向测试分数:学生在能力倾向测试中取得的最终得分
* 软技能评级:学生获得的软技能综合评分
* 课外活动:学生是否参与过课外活动
* 就业培训:学生是否接受过就业相关培训
* SSC_Marks:学生中等教育证书考试成绩(SSC_Marks)
* HSC_Marks:学生高级中等教育证书考试成绩(HSC_Marks)
* PlacementStatus:用于标注学生就业状态的分类标签(PlacementStatus)
## 应用场景
- 可通过该数据集开展特征分析,识别对就业成功率影响程度更高的关键因素
- 可基于该数据集构建分类模型,以实现对新学生样本的就业概率推断
## 数据集变体
该数据同时提供了[文本格式版本](https://huggingface.co/datasets/Krooz/Campus_Recruitment_Text),适用于大语言模型(LLM)的微调任务。
PS:若本数据集对您有所帮助,不妨点赞支持 :)
提供机构:
Krooz
原始信息汇总
数据集描述
该数据集包含XYZ校园学生的就业数据。基于学生的表现数据,我们对其就业状态进行分类。学生报告包括以下信息:
- CGPA - 学生在大学的成绩
- Internships - 学生在最终就业前完成的实习次数
- Projects - 学生完成的项目数量
- Workshops/Certifications - 学生参加的工作坊次数和拥有的证书
- AptitudeTestScore - 学生在考试中获得的能力分数
- SoftSkillsRating - 学生获得的软技能评级
- ExtracurricularActivities - 学生是否有课外活动
- PlacementTraining - 学生是否接受过就业培训
- SSC_Marks - 学生在中等教育证书考试中的成绩
- HSC_Marks - 学生在高级中等教育证书考试中的成绩
- PlacementStatus - 学生的就业状态(是否已就业)
用途
- 该数据可用于分析数据的各种特征,并确定哪些特征对就业成功贡献更大
- 可以在该数据基础上构建分类模型,推断新学生的就业概率
搜集汇总
数据集介绍

构建方式
在高等教育与就业衔接的研究领域,数据集的构建往往依赖于对特定学生群体特征的系统性采集。本数据集聚焦于某校园学生的就业安置情况,其构建过程通过收集学生在校期间的学术表现与综合能力指标实现。具体而言,数据涵盖了学生的累计平均绩点、实习经历数量、项目完成数量、参与的研讨会与认证数量、能力倾向测试得分、软技能评级、课外活动参与情况、就业培训经历以及中学阶段的学业成绩。这些结构化字段均以数值或分类形式记录,最终以每位学生的就业状态作为标注标签,从而形成一个可用于分类分析的数据集合。
特点
该数据集在就业预测与教育分析领域展现出鲜明的特点。其核心在于整合了多维度的学生特征,不仅包含传统的学术成绩如CGPA和中学分数,还纳入了实习、项目、软技能等反映实践能力与综合素质的指标。这种设计使得数据能够较为全面地刻画学生的整体竞争力,为探究影响就业成功的因素提供了丰富维度。数据规模适中,属于千至万条记录级别,且以英文呈现,适用于构建分类模型或进行特征重要性分析,尤其适合教育数据挖掘与机器学习应用场景。
使用方法
在应用层面,该数据集主要服务于教育数据挖掘与预测建模任务。研究人员或实践者可通过加载CSV格式的数据,利用机器学习算法训练分类模型,以预测新学生的就业可能性。典型流程包括数据预处理、特征工程、模型选择与评估等步骤。此外,数据集也可用于探索性分析,通过统计方法或可视化工具识别影响就业结果的关键因素,如比较学术成绩与实习经历对安置状态的贡献度。对于希望微调大语言模型的用户,同源文本格式的数据变体提供了另一种适配方案。
背景与挑战
背景概述
随着高等教育与就业市场关联性的日益增强,学生就业预测成为教育数据挖掘领域的重要研究方向。Krooz/Campus_Recruitment_CSV数据集由匿名研究团队于近年构建,聚焦于校园招聘背景下学生就业状态的多维度分类问题。该数据集整合了学业成绩、实习经历、项目参与、技能认证及软实力评估等关键特征,旨在通过机器学习方法揭示影响学生就业成功的核心因素。其出现为教育机构优化培养方案、企业精准招聘以及学生自我规划提供了数据驱动的决策支持,推动了教育分析与职业发展研究的交叉融合。
当前挑战
该数据集致力于解决学生就业状态预测这一分类任务,其核心挑战在于如何从多源异构的教育背景数据中提取有效特征,以准确建模学业表现、实践经历与软技能等复杂因素对就业结果的非线性影响。在构建过程中,数据收集面临学生隐私保护与信息标准化难题,例如不同教育体系的成绩换算、软技能的主观评价量化等;同时,样本规模有限且可能存在选择偏差,如仅涵盖特定校园或专业领域,这限制了模型的泛化能力与公平性评估。
常用场景
经典使用场景
在高等教育与职业发展领域,Campus_Recruitment_CSV数据集为研究学生就业预测提供了关键数据支撑。该数据集通过整合学生的学术成绩、实习经历、项目参与、软技能评分等多维度特征,构建了一个全面的学生画像。经典使用场景聚焦于构建分类模型,以预测学生的就业状态(是否获得录用),这有助于教育机构评估课程设置的有效性,并为学生提供个性化的职业规划指导。
衍生相关工作
围绕该数据集,已衍生出多项经典研究工作,包括基于传统机器学习算法(如逻辑回归、决策树)的就业预测模型比较,以及利用深度学习技术进行特征自动提取的探索。部分研究进一步扩展了数据应用,结合自然语言处理技术分析学生文本报告,以提升预测精度。这些工作共同推动了教育人工智能领域的发展,并为后续大规模学生就业数据分析奠定了基础。
数据集最近研究
最新研究方向
在高等教育与就业预测领域,Krooz/Campus_Recruitment_CSV数据集正成为研究学生就业成功因素的关键资源。当前前沿研究聚焦于利用机器学习模型,如梯度提升决策树和神经网络,深入分析学业成绩、实习经历、项目参与等多维特征对就业结果的影响机制。热点方向包括结合可解释人工智能技术,揭示特征间的交互作用与非线性关系,以提升预测透明度和公平性。此外,该数据集与大型语言模型的结合应用,如文本格式变体的微调,推动了自然语言处理在教育评估中的创新,为高校职业指导政策优化和个性化干预策略提供了数据驱动的科学依据,具有重要的实践意义。
以上内容由遇见数据集搜集并总结生成



