five

student-burnout-analysis2026

收藏
Hugging Face2026-04-06 更新2026-04-07 收录
下载链接:
https://huggingface.co/datasets/eliel2003/student-burnout-analysis2026
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个关于大学生学业倦怠的合成数据集,旨在探讨外部环境压力源(如经济压力和家庭期望)与学业倦怠水平之间的关系,并研究社会支持的调节作用。数据集包含1,000,000条记录,每条记录有20个特征,包括人口统计、生活方式、心理、环境和学术等方面的信息。目标变量为'学业倦怠水平',是压力、焦虑和抑郁得分的综合指标。为便于分析,从原始数据中随机抽取了2,000条记录。数据集适用于表格回归任务,可用于研究心理健康、经济学和心理学等领域的问题。需要注意的是,由于数据集是合成的,分析结果在推广到现实世界学生群体时应谨慎解释。

This is a synthetic dataset focused on academic burnout among college students, designed to explore the relationship between external environmental stressors (such as financial stress and family expectations) and the level of academic burnout, as well as investigate the moderating role of social support. The dataset contains 1,000,000 records, with 20 features per record covering demographics, lifestyle, psychological factors, environmental factors and academic aspects. The target variable is "the level of academic burnout", which is a composite index calculated from the scores of stress, anxiety and depression. For analytical convenience, a random subsample of 2,000 records was extracted from the original dataset. This dataset is suitable for tabular regression tasks, and can be used to study issues in fields such as mental health, economics and psychology. It should be noted that since this is a synthetic dataset, the analytical results should be interpreted with caution when generalized to real-world student populations.
创建时间:
2026-04-05
原始信息汇总

数据集概述:Socio-Economic Drivers of Student Burnout

基本信息

  • 数据集名称:Socio-Economic Drivers of Student Burnout
  • 数据集地址:https://huggingface.co/datasets/eliel2003/student-burnout-analysis2026
  • 主要语言:英语
  • 许可证:MIT
  • 数据规模:1M+(采样至2,000条记录)
  • 任务类别:表格回归
  • 标签:心理健康、经济学、心理学、学生倦怠
  • 数据集描述:预测学业倦怠:学生压力源的多变量分析

数据来源与构成

  • 原始来源:Kaggle – Student Mental Health and Burnout Dataset (https://www.kaggle.com/datasets/sharmajicoder/student-mental-health-and-burnout)
  • 总记录数:1,000,000
  • 特征数量:20
  • 分析所用样本:2,000(随机采样,random_state=42
  • 目标变量academic_burnout_level(压力、焦虑和抑郁分数的综合)
  • 数据性质说明:基于结构特征(100万条记录中零缺失值、完全均匀的特征分布、缺乏真实世界噪声),该数据集被评估为合成生成。虽然这支持了干净、可重复的分析,但研究结果应谨慎解释,可能无法直接推广到真实世界学生群体。

特征分类

类别 特征
人口统计 age, gender, academic_year
生活方式 study_hours_per_day, sleep_hours, physical_activity, screen_time
心理 stress_level, anxiety_score, depression_score, exam_pressure
环境 financial_stress, family_expectation, social_support
学业 academic_performance
目标 academic_burnout_level

研究假设

  1. H1:更高水平的财务压力和家庭期望与增加的学业倦怠呈正相关
  2. H2:社会支持起到调节缓冲作用;对于具有高社会支持的学生,环境压力源对倦怠的负面影响将显著减弱。

关键发现

  • H1得到证实:倦怠水平从低压力组的1.12上升到高压力组的2.66,在财务压力范围内增加了一倍以上;财务压力与倦怠的相关系数为 r = 0.32。
  • H2得到证实:在高财务压力的学生中,低社会支持的学生平均倦怠为3.83,而高社会支持的学生仅为1.80,减少了**50%**以上,表明社会支持能有效缓冲压力对倦怠的影响。
  • 主要相关性
    • financial_stress 与倦怠呈最高正相关(r = 0.32)。
    • social_support 与倦怠呈最强负相关(r = −0.23)。
    • family_expectation 与倦怠呈正相关(r = 0.23)。
  • 年龄影响:倦怠水平在各年龄组间相对稳定(<20岁为1.64,21–23岁为1.83,>23岁为1.84),表明年龄不是该数据集中倦怠的主要驱动因素。

方法论与技术栈

  • 数据加载与采样:通过 kagglehub 下载完整数据集,并提取可重复的随机样本。
  • 数据清洗:无缺失值,无重复行,数据类型符合预期。
  • 异常值处理:保留所有异常值,因其代表学生群体中合法的极端经历。
  • 特征工程:创建了三个分类分箱变量以支持组级比较和多变量可视化。
  • 技术栈
    • 语言:Python 3.12
    • 数据处理:pandas, numpy
    • 可视化:matplotlib, seaborn
    • 数据集获取:kagglehub
    • 环境:Google Colab

结论

该分析的核心发现是,社会支持不仅仅是低倦怠的相关因素,它还能主动调节财务压力造成的损害。经历高财务压力的学生并非注定会有高倦怠;强大的社会支持网络可以将这种风险降低一半。从政策角度看,这表明针对倦怠的大学干预措施不仅应关注减少压力源(例如经济援助、管理家庭期望),更关键的是应加强社会支持系统(如同伴计划、咨询访问和社区建设倡议),特别是对于那些处于高压力财务环境中的学生。

搜集汇总
数据集介绍
main_image_url
构建方式
该数据集源自Kaggle平台,原始规模包含一百万条学生记录,每条记录涵盖二十个特征维度。为确保分析效率与统计稳健性之间的平衡,研究团队采用分层随机抽样策略,以固定随机种子提取了两千条记录构成分析样本。数据生成过程呈现出完全无缺失值、特征分布高度均匀的特性,结合其结构特征判断,该数据集属于合成生成数据,虽具备良好的可复现性,但应用于现实场景时需注意其潜在局限性。
特点
数据集聚焦于大学生心理健康领域,核心目标变量为学术倦怠水平,该变量由压力、焦虑与抑郁得分复合构建而成。特征体系涵盖人口统计学、生活方式、心理状态、环境压力及学业表现五大类别,其中环境压力维度下的经济压力与家庭期望作为关键自变量,社会支持则被设定为调节变量。数据分布显示,经济压力呈轻度右偏态,社会支持呈近似对称分布,学术倦怠水平则接近正态分布,这为探究多变量间的复杂关系提供了良好的变异基础。
使用方法
数据集适用于表格回归任务,主要服务于学术倦怠影响因素的多元分析。使用者可通过Kagglehub接口获取完整数据,并依据研究需求进行二次抽样或特征工程。分析流程建议遵循标准数据科学工作流:包括数据加载与清洗、异常值检测与处理、特征分箱构建以及统计可视化。研究证实,经济压力与社会支持对倦怠水平具有显著预测力,且社会支持表现出明确的缓冲效应,因此该数据集特别适合用于验证压力缓冲模型及设计针对性干预策略的模拟研究。
背景与挑战
背景概述
学生学业倦怠现象作为高等教育心理学领域的重要议题,近年来受到广泛关注。该数据集由研究团队于2026年构建,旨在探究社会经济因素与学生心理健康之间的复杂关联。其核心研究问题聚焦于外部环境压力源——特别是财务压力与家庭期望——如何影响大学生的学业倦怠水平,并考察社会支持在其中所起的调节作用。通过整合百万量级的合成数据记录,该数据集为理解压力与保护性因素的交互机制提供了实证基础,对推动学生心理健康干预策略的制定具有重要参考价值。
当前挑战
该数据集致力于解决学业倦怠的多维预测与归因分析这一领域挑战,其难点在于如何准确量化并分离财务压力、家庭期望等环境变量对心理状态的独立与交互影响。在构建过程中,研究面临的主要挑战源于数据本身的合成性质:尽管数据集具备规模庞大、结构规整的优势,但其特征分布过于均匀且缺乏现实噪声,可能导致模型在真实学生群体中的泛化能力受限。此外,如何在保留极端个案以反映真实心理状况的同时,确保统计分析的稳健性,亦是数据处理中的关键考量。
常用场景
经典使用场景
在高等教育心理学领域,该数据集常被用于探索学生学业倦怠的多维成因。研究者通过整合人口统计学、生活方式及环境压力等特征,构建回归模型以量化财务压力、家庭期望等外部应激源对学业倦怠水平的影响。经典应用场景包括利用分层抽样样本进行探索性数据分析,通过散点图、热力图等可视化手段揭示变量间的线性关系与缓冲效应,为后续干预策略提供数据驱动的见解。
实际应用
在实际应用中,该数据集为高校学生事务管理提供了决策支持。教育机构可依据分析结果,针对高财务压力群体设计定向社会支持项目,如朋辈辅导、心理咨询服务或社区建设活动。同时,数据驱动的洞察有助于优化资源分配,优先加强保护性因素建设,从而降低学生倦怠风险,提升整体学业表现与心理健康水平。
衍生相关工作
围绕该数据集衍生的经典工作主要集中在机器学习与心理测量交叉领域。例如,基于特征工程构建的学业倦怠预测模型被广泛应用于早期预警系统;同时,研究通过调节效应分析深化了社会支持的理论框架,催生了多项关于校园干预措施有效性的实证研究,推动了学生心理健康研究的定量化与精细化发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作