five

StudentLife Dataset|教育数据分析数据集|心理健康监测数据集

收藏
github2020-09-19 更新2024-05-31 收录
教育数据分析
心理健康监测
下载链接:
https://github.com/Chirag-Bansal/StudentLife-Dataset
下载链接
链接失效反馈
资源简介:
StudentLife数据集是一个使用学生手机传感数据来评估其心理健康、学术表现和行为趋势的数据集。

The StudentLife dataset is a collection that utilizes smartphone sensor data from students to assess their mental health, academic performance, and behavioral trends.
创建时间:
2020-03-01
原始信息汇总

数据集概述

名称: StudentLife Dataset

目的: 使用学生的手机传感数据评估其心理健康、学术表现和行为趋势。

数据来源: 手机传感数据,包括学生的物理活动(静止、行走或跑步)。

数据处理

原始数据: 包含学生的位置信息,每秒记录一次,使用UNIX时间戳。

数据转换:

  • 使用CreateCsv.py脚本将R tibbles格式转换为CSV格式。
  • 使用Manipulate.py脚本将数据转换为每小时格式,包含学生ID、日编号、小时、活动和持续时间。
  • 移除了活动值为3(未知位置)的数据。

输出文件:

  • final.csv:用于训练,包含学生0-49的数据。
  • final_test.csv:用于测试,包含学生50-59的数据。

数据详情

文件结构:

  • StudentId: 学生ID
  • Day Number: 周日的编号(0-6)
  • Hour: 24小时制的小时
  • Activity: 活动类型(0: 静止, 1: 行走, 2: 跑步)
  • Duration: 相应活动的持续时间

模型与评估

模型:

  • 决策树回归器
  • 随机森林回归器
  • 多项式回归器(与线性回归器比较)
  • XGBoost
  • 神经网络(使用Keras)

评估指标: 均方误差(MAE)

评估结果:

  • 随机森林回归器: MAE = 190.22
  • 多项式回归器: MAE = 191.60(线性回归器: MAE = 334.12)
  • XGBoost: MAE = 190.66
  • 决策树回归器: MAE = 190.23
  • 神经网络: MAE = 186.13(最佳架构)

其他尝试

  • 尝试按小时查找模式,但大多数小时的模式为0,表明学生大部分时间处于静止状态。
  • 尝试使用每个学生的数据进行预测,结果显示使用个人数据预测的MAE显著低于使用通用趋势预测的MAE。

特定学生预测结果:

  • 随机森林回归器: MAE = 85.13
  • 多项式回归器: MAE = 98.8

相关脚本:

  • TestingForStudent.py: 创建CSV文件并运行随机森林回归器。
  • PolynomialRegressorForStudent.py: 运行多项式回归器。
AI搜集汇总
数据集介绍
main_image_url
构建方式
StudentLife Dataset通过收集学生手机中的感知数据,构建了一个用于评估学生心理健康、学术表现和行为趋势的数据集。数据集的构建过程中,首先从达特茅斯大学网站获取了原始数据,并将其转换为R tibbles格式。随后,通过编写Python脚本`CreateCsv.py`将数据转换为CSV格式,以便于后续处理。为了适应预测任务的需求,数据集中的时间戳信息被转换为每小时的时间格式,并去除了未知位置的活动数据。最终,数据被分为训练集和测试集,分别用于学生0-49和学生50-59的活动预测。
使用方法
使用StudentLife Dataset时,研究者可以通过加载`final.csv`和`final_test.csv`文件进行训练和测试。数据集的每条记录包含学生ID、天数、小时、活动类型和持续时间等字段,适合用于回归问题的建模。研究者可以选择不同的回归算法,如决策树回归、随机森林回归、多项式回归、XGBoost和神经网络等,来预测学生的活动持续时间。通过比较不同模型的均方误差(MAE),可以选择最优的模型进行进一步分析和应用。
背景与挑战
背景概述
StudentLife Dataset是由达特茅斯学院的研究团队创建的,旨在通过收集学生手机中的感知数据来评估其心理健康、学术表现和行为趋势。该数据集的核心研究问题是通过分析学生的物理活动数据(如静止、行走或跑步),预测学生未来一小时的活动状态。这一研究不仅为心理健康评估提供了新的数据支持,还为行为预测和个性化教育提供了潜在的应用价值。
当前挑战
StudentLife Dataset在构建过程中面临多项挑战。首先,数据集需要从UNIX时间戳中提取每秒的学生位置信息,并将其转换为每小时的数据格式,这一过程涉及复杂的数据处理和时间序列分析。其次,数据集中存在未知位置的活动数据(标记为3),这些数据对结果产生干扰,需进行剔除。此外,不同学生的行为模式差异显著,使用通用模型进行预测可能导致误差,因此需要针对个体进行个性化预测。
常用场景
经典使用场景
StudentLife Dataset的经典使用场景主要集中在通过学生手机传感器数据来预测其未来的活动模式。该数据集通过收集学生在不同时间段内的活动状态(如静止、行走或跑步),结合时间戳信息,构建了一个基于回归问题的预测模型。研究者可以利用这些数据来预测学生在接下来一小时内可能的活动类型及其持续时间,从而为个性化健康管理和学术表现评估提供数据支持。
解决学术问题
StudentLife Dataset解决了心理学和教育学领域中关于学生行为模式与心理健康、学术表现之间关系的研究问题。通过分析学生的日常活动数据,研究者可以深入探讨学生的行为习惯如何影响其心理状态和学业成绩。这一数据集为研究者提供了一个量化分析的工具,有助于揭示潜在的行为模式与心理健康之间的关联,从而为制定干预措施提供科学依据。
实际应用
StudentLife Dataset在实际应用中具有广泛的前景,特别是在个性化健康管理和教育干预领域。例如,学校可以通过分析学生的活动数据,及时发现其心理健康问题并提供相应的支持。此外,教育机构可以利用这些数据来优化课程安排,确保学生在学习过程中保持良好的身心状态。该数据集还可用于开发智能健康监测系统,帮助学生更好地管理自己的日常活动和健康状况。
数据集最近研究
最新研究方向
在心理健康与行为分析领域,StudentLife Dataset凭借其对学生日常活动数据的细致捕捉,成为研究学生心理状态与行为模式的重要资源。该数据集通过手机传感技术,收集了学生的物理活动、位置信息等数据,旨在预测学生未来的活动趋势,进而评估其心理健康状况。近年来,研究者们利用该数据集探索了多种机器学习算法,如决策树回归、随机森林回归、XGBoost等,以提高活动预测的准确性。特别值得注意的是,个性化预测模型的引入,通过利用个体学生的历史数据进行预测,显著降低了预测误差,为个性化心理干预提供了新的可能性。这一研究方向不仅推动了心理健康评估的精确化,也为教育领域中的个性化支持系统奠定了技术基础。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
5,000+
优质数据集
54 个
任务类型
进入经典数据集