five

Government Secondary School Manchok, Kaura LGA, Kaduna State, Nigeria 学生成绩数据集

收藏
github2024-10-09 更新2024-10-31 收录
下载链接:
https://github.com/Juwon-Ogunseye/Datathon
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含尼日利亚卡杜纳州Kaura LGA的Manchok政府中学学生的学术记录,特别是JSS3(初中9年级)学生的成绩,涵盖一个学期的学术表现,具体为第三学期。数据集还包括家长参与数据和教师反馈数据。

This dataset contains academic records of students from Government Secondary School Manchok, Kaura Local Government Area (LGA) in Kaduna State, Nigeria. Specifically, it covers the academic performance scores of Junior Secondary School 3 (JSS3, 9th-grade junior high school) students for the third term of one semester. It also includes parental engagement data and teacher feedback data.
创建时间:
2024-10-04
原始信息汇总

数据集概述

数据来源

数据集来自尼日利亚卡杜纳州考拉地方政府区曼乔克政府中学,包含**JSS3(初中9年级)**学生的学术记录,涵盖一个学期的学术表现,具体为第三学期。

数据内容

数据集包含以下主要数据:

  • 学生成绩数据:包括学生在不同科目(如数学、英语、科学等)的考试成绩。
  • 家长参与数据:包含学校WhatsApp群组中的家长反馈文本,通过情感分析评估家长参与度。
  • 教师反馈数据:包含教师对学生行为和整体表现的评估数据。

数据处理

数据通过Google Sheets API获取,并使用以下工具进行处理和存储:

  • DuckDB:用于本地查询和数据存储。
  • MotherDuck:用于远程存储和查询大型数据集。
  • Pandas:用于数据操作和转换。

数据存储

数据存储在以下表格中:

  • Student_Exams_Record:包含学生各科考试成绩。
  • Student_Profile:包含学生人口统计信息。
  • Teacher_Data:包含教师对学生行为和表现的评估数据。
  • Parent_Sentiment:包含从WhatsApp群组聊天中分析的家长情感数据。

数据流

  1. Google Sheets:数据存储在多个Google Sheets中。
  2. Google Sheets API:Airflow使用Google Sheets API获取实时数据。
  3. Airflow DAGs:自动化工作流执行以下步骤:
    • 获取新数据。
    • 处理数据(转换、处理新条目)。
    • 将数据推送到DuckDB和MotherDuck。
  4. 情感分析:对WhatsApp群组聊天数据进行情感分析。
  5. 机器学习模型:基于可用数据和元数据预测学生成功。

数据集用途

数据集用于预测学生潜在成功,并分析家长情感和教师评估对学生学术表现的影响。

搜集汇总
数据集介绍
main_image_url
构建方式
该数据集的构建基于尼日利亚卡杜纳州Kaura LGA的Manchok政府中学的学生成绩数据。数据涵盖了JSS3(九年级)学生的第三学期学术表现,包括考试成绩、家长参与数据和教师反馈。数据通过Google Sheets API从Google Sheets中提取,并使用Apache Airflow进行自动化处理,将数据存储在DuckDB和MotherDuck中。数据处理过程中,应用了数据挖掘和数据工程技术,确保数据的准确性和完整性。
特点
该数据集的显著特点在于其多源数据的整合,包括学生成绩、家长通过WhatsApp群组的参与数据以及教师的反馈。这些数据通过情感分析和机器学习技术进行处理,以预测学生的学术成功并评估外部因素对学生表现的影响。此外,数据集严格遵守隐私保护规则,确保学生身份的保密性。
使用方法
使用该数据集时,首先需通过Google Sheets API获取实时数据,并利用Apache Airflow进行数据处理和存储。用户可以通过Jupyter Notebook进行模型训练,使用Pandas进行数据清洗和准备,DuckDB和MotherDuck进行数据存储,以及scikit-learn构建预测模型。最终,模型可以通过Streamlit部署为Web应用,便于教育工作者实时监控和评估学生的学术表现。
背景与挑战
背景概述
政府中学Manchok,位于尼日利亚卡杜纳州Kaura LGA,其学生成绩数据集聚焦于分析学生学术表现及其相关元数据,旨在通过预测学生潜在成功来评估外部因素如家长参与和教师反馈对其学术表现的影响。该数据集由政府中学Manchok提供,涵盖了JSS3(九年级)学生在一个学期的学术记录,具体为第三学期。数据集的创建旨在通过机器学习技术,结合家长和教师的输入,预测学生的学术成功,并对教育系统中的家长参与动态进行深入研究。
当前挑战
该数据集面临的挑战包括:1) 数据隐私保护,确保学生身份信息的安全性;2) 数据整合与处理,需从多个Google Sheets中提取并整合学生成绩、家长参与及教师反馈数据;3) 情感分析的准确性,对家长在WhatsApp群组中的互动进行情感分析,以量化家长参与度;4) 模型预测的精确性,构建和训练机器学习模型以准确预测学生学术表现,同时考虑多维度的输入数据。
常用场景
经典使用场景
该数据集的经典使用场景主要集中在教育数据分析领域,特别是针对学生学术表现的预测与评估。通过整合学生考试成绩、家长参与度以及教师反馈等多维度数据,研究者能够构建预测模型,以评估学生的潜在成功率。此数据集的应用不仅限于学术研究,还可用于开发教育干预措施,旨在通过数据驱动的决策提升学生的学业表现。
衍生相关工作
基于该数据集,研究者们开发了多种机器学习模型和自然语言处理工具,用于分析和预测学生的学术表现。例如,通过情感分析技术,研究者能够量化家长在WhatsApp群组中的参与度,并将其与学生的成绩进行关联分析。此外,该数据集还促进了教育数据科学领域的发展,推动了更多关于教育数据挖掘和分析的研究工作。
数据集最近研究
最新研究方向
在教育数据分析领域,Government Secondary School Manchok, Kaura LGA, Kaduna State, Nigeria 学生成绩数据集的研究聚焦于通过整合学生成绩、家长参与和教师反馈等多维度数据,预测学生的学术表现。该研究不仅关注传统的学术成绩,还引入了家长在WhatsApp群组中的情感分析,以量化家长参与对学生成绩的影响。此外,研究还利用机器学习模型,如分类模型,来预测学生的潜在成功,并通过部署AI应用,如教师问题指南,以辅助教师进行教学实践和学生评估。这些前沿研究不仅提升了教育数据分析的深度和广度,还为教育政策的制定和实施提供了科学依据。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务