Krooz/Campus_Recruitment_CSV

Name: Krooz/Campus_Recruitment_CSV
Creator: Krooz
Published: 2024-02-21 05:20:19
License: 暂无描述

Hugging Face2024-02-21 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/Krooz/Campus_Recruitment_CSV

下载链接

链接失效反馈

官方服务：

资源简介：

--- license: cc0-1.0 task_categories: - text-classification language: - en tags: - education size_categories: - 1K<n<10K --- ## Dataset Description This data set consists of Placement data of students in a XYZ campus. Based on the student's performance data we are classifying his Placement Status. The students report includes the following information: * CGPA - The grade of the student in his university * Internships - The no of internship done by the student before final placement * Projects - The no of projects done by the student * Workshops/Certifications - The no of workshops attended and the certifications student had * AptitudeTestScore - The aptitude score the student attained from the exam * SoftSkillsRating - The soft skill rating attained by the student * ExtracurricularActivities - Did the student has some extra curricular activities * PlacementTraining - Did the student got placement training * SSC_Marks - The senior secondary school marks scored by the student * HSC_Marks - The higher secondary school marks scored by the student * PlacementStatus - The label whether the student is Placed or not ## Usecases - The data can be used to analyse various features of the data and determine which contributes more for the placement success - The classification model can be build on top of the data to infer for a new students record the placement probability # Variants The same data is also available in a [Text format](https://huggingface.co/datasets/Krooz/Campus_Recruitment_Text) which is useful for finetuning an LLM. PS: Do give a like if you found the dataset useful :)

许可证：CC0 1.0 任务类别： - 文本分类（text-classification）语言： - 英语（en）标签： - 教育（education）样本规模区间： - 1000 < 样本数量 < 10000 ## 数据集描述本数据集收录了某XYZ校园的学生就业相关数据，旨在基于学生的各项学业与实践表现数据，对其最终就业状态进行分类。学生数据集包含以下字段： * CGPA：学生在校平均绩点（CGPA） * 实习经历：学生正式就业前完成的实习总次数 * 项目经历：学生在校期间完成的项目总数量 * 工坊/认证经历：学生参与的工坊活动数量与取得的认证总数 * 能力倾向测试分数：学生在能力倾向测试中取得的最终得分 * 软技能评级：学生获得的软技能综合评分 * 课外活动：学生是否参与过课外活动 * 就业培训：学生是否接受过就业相关培训 * SSC_Marks：学生中等教育证书考试成绩（SSC_Marks） * HSC_Marks：学生高级中等教育证书考试成绩（HSC_Marks） * PlacementStatus：用于标注学生就业状态的分类标签（PlacementStatus） ## 应用场景 - 可通过该数据集开展特征分析，识别对就业成功率影响程度更高的关键因素 - 可基于该数据集构建分类模型，以实现对新学生样本的就业概率推断 ## 数据集变体该数据同时提供了[文本格式版本](https://huggingface.co/datasets/Krooz/Campus_Recruitment_Text)，适用于大语言模型（LLM）的微调任务。 PS：若本数据集对您有所帮助，不妨点赞支持 :)

提供机构：

Krooz

原始信息汇总

数据集描述

该数据集包含XYZ校园学生的就业数据。基于学生的表现数据，我们对其就业状态进行分类。学生报告包括以下信息：

CGPA - 学生在大学的成绩
Internships - 学生在最终就业前完成的实习次数
Projects - 学生完成的项目数量
Workshops/Certifications - 学生参加的工作坊次数和拥有的证书
AptitudeTestScore - 学生在考试中获得的能力分数
SoftSkillsRating - 学生获得的软技能评级
ExtracurricularActivities - 学生是否有课外活动
PlacementTraining - 学生是否接受过就业培训
SSC_Marks - 学生在中等教育证书考试中的成绩
HSC_Marks - 学生在高级中等教育证书考试中的成绩
PlacementStatus - 学生的就业状态（是否已就业）

用途

该数据可用于分析数据的各种特征，并确定哪些特征对就业成功贡献更大
可以在该数据基础上构建分类模型，推断新学生的就业概率

搜集汇总

数据集介绍

构建方式

在高等教育与就业衔接的研究领域，数据集的构建往往依赖于对特定学生群体特征的系统性采集。本数据集聚焦于某校园学生的就业安置情况，其构建过程通过收集学生在校期间的学术表现与综合能力指标实现。具体而言，数据涵盖了学生的累计平均绩点、实习经历数量、项目完成数量、参与的研讨会与认证数量、能力倾向测试得分、软技能评级、课外活动参与情况、就业培训经历以及中学阶段的学业成绩。这些结构化字段均以数值或分类形式记录，最终以每位学生的就业状态作为标注标签，从而形成一个可用于分类分析的数据集合。

特点

该数据集在就业预测与教育分析领域展现出鲜明的特点。其核心在于整合了多维度的学生特征，不仅包含传统的学术成绩如CGPA和中学分数，还纳入了实习、项目、软技能等反映实践能力与综合素质的指标。这种设计使得数据能够较为全面地刻画学生的整体竞争力，为探究影响就业成功的因素提供了丰富维度。数据规模适中，属于千至万条记录级别，且以英文呈现，适用于构建分类模型或进行特征重要性分析，尤其适合教育数据挖掘与机器学习应用场景。

使用方法

在应用层面，该数据集主要服务于教育数据挖掘与预测建模任务。研究人员或实践者可通过加载CSV格式的数据，利用机器学习算法训练分类模型，以预测新学生的就业可能性。典型流程包括数据预处理、特征工程、模型选择与评估等步骤。此外，数据集也可用于探索性分析，通过统计方法或可视化工具识别影响就业结果的关键因素，如比较学术成绩与实习经历对安置状态的贡献度。对于希望微调大语言模型的用户，同源文本格式的数据变体提供了另一种适配方案。

背景与挑战

背景概述

随着高等教育与就业市场关联性的日益增强，学生就业预测成为教育数据挖掘领域的重要研究方向。Krooz/Campus_Recruitment_CSV数据集由匿名研究团队于近年构建，聚焦于校园招聘背景下学生就业状态的多维度分类问题。该数据集整合了学业成绩、实习经历、项目参与、技能认证及软实力评估等关键特征，旨在通过机器学习方法揭示影响学生就业成功的核心因素。其出现为教育机构优化培养方案、企业精准招聘以及学生自我规划提供了数据驱动的决策支持，推动了教育分析与职业发展研究的交叉融合。

当前挑战

该数据集致力于解决学生就业状态预测这一分类任务，其核心挑战在于如何从多源异构的教育背景数据中提取有效特征，以准确建模学业表现、实践经历与软技能等复杂因素对就业结果的非线性影响。在构建过程中，数据收集面临学生隐私保护与信息标准化难题，例如不同教育体系的成绩换算、软技能的主观评价量化等；同时，样本规模有限且可能存在选择偏差，如仅涵盖特定校园或专业领域，这限制了模型的泛化能力与公平性评估。

常用场景

经典使用场景

在高等教育与职业发展领域，Campus_Recruitment_CSV数据集为研究学生就业预测提供了关键数据支撑。该数据集通过整合学生的学术成绩、实习经历、项目参与、软技能评分等多维度特征，构建了一个全面的学生画像。经典使用场景聚焦于构建分类模型，以预测学生的就业状态（是否获得录用），这有助于教育机构评估课程设置的有效性，并为学生提供个性化的职业规划指导。

衍生相关工作

围绕该数据集，已衍生出多项经典研究工作，包括基于传统机器学习算法（如逻辑回归、决策树）的就业预测模型比较，以及利用深度学习技术进行特征自动提取的探索。部分研究进一步扩展了数据应用，结合自然语言处理技术分析学生文本报告，以提升预测精度。这些工作共同推动了教育人工智能领域的发展，并为后续大规模学生就业数据分析奠定了基础。

数据集最近研究