five

Student_100|教育数据分析数据集|编程学习数据集

收藏
arXiv2025-05-26 更新2025-05-28 收录
教育数据分析
编程学习
下载链接:
http://arxiv.org/abs/2505.19997v1
下载链接
链接失效反馈
资源简介:
Student_100数据集由浙江大学的研究团队创建,包含100名学生在Python编程任务上的5000条学习记录。该数据集旨在模拟不同认知水平学生的行为,通过构建知识图谱来捕捉学生过去学习记录中的概念理解,进而预测学生在新任务上的表现。数据集经过精心设计,确保了每个学生的认知状态在一定时间内保持稳定,并提供了详细的任务描述、学生行为和解决方案等信息。该数据集适用于教育研究领域,有助于评估教学策略、评估智能辅导系统以及增强AI教育工具,旨在解决当前LLM模型在模拟不同认知水平学生行为方面的局限性。
提供机构:
浙江大学计算机科学与技术学院, 浙江大学教育学院, 香港科技大学
创建时间:
2025-05-26
AI搜集汇总
数据集介绍
main_image_url
构建方式
在编程教育领域,准确模拟学生认知行为对教学策略评估至关重要。Student_100数据集通过构建知识图谱驱动的认知原型框架实现这一目标:首先从100名学生的5,000条Python编程学习记录中提取多层级知识概念(如基础语法、算法设计),通过四阶段迭代过程(概念提取、关系建模、局部认知状态分析、全局认知原型构建)形成自然语言表示的知识图谱;随后将认知原型映射到新任务进行概念感知的行为预测;最终采用束搜索自优化方法生成符合认知水平的解决方案,确保错误模拟的真实性。数据集严格筛选一周内的连续学习记录以保证认知状态稳定性,并由专业标注员补充任务描述和行为分析。
使用方法
使用本数据集需遵循认知仿真三阶段流程:原型构建阶段,将学生的历史记录输入πdesc模型生成任务描述,经πnode提取知识概念后构建带认知状态库的知识图谱;行为预测阶段,通过πpred模型比对任务描述与图谱节点的语义相似度,检索最相关的历史记录预测可能错误;解决方案生成阶段,基于预测行为采用束搜索算法(默认L=3迭代,B=2候选)逐步优化代码输出,直至πvalue模型评分超过δ=0.9阈值。实验表明,该框架在GPT-4o等模型上实现94%的行为预测准确率,解决方案与真实错误的匹配度达3.83分(5分制),特别适用于智能辅导系统的对抗测试和教学策略验证。
背景与挑战
背景概述
Student_100数据集由浙江大学计算机科学与技术学院和教育学院的研究团队于2025年创建,旨在解决基于大语言模型(LLM)的学生行为模拟中的关键挑战。该数据集包含100名学生在Python编程任务中的5000条学习记录,重点关注模拟不同认知水平学生的多样化学习模式。该数据集的建立填补了教育模拟领域缺乏细粒度认知状态标注数据的空白,为个性化教育策略评估和智能辅导系统开发提供了重要基准。其创新性体现在通过知识图谱构建认知原型,突破了传统LLM作为'完美助手'的局限,首次实现了对学生典型错误模式的系统性建模。
当前挑战
该数据集面临双重挑战:在领域问题层面,需解决LLM难以模拟学生认知缺陷的问题——现有模型倾向于生成过度完美的答案,无法复现真实学习过程中的错误模式;在构建过程中,需克服三大技术难点:1) 从编程代码中提取多层次知识概念的语义表征,2) 建立跨任务的概念映射关系以预测个性化错误,3) 设计自优化机制确保模拟方案与认知预测的一致性。此外,数据标注需要教育专家对编程错误进行细粒度分类,这对标注者的专业素养提出了极高要求。
常用场景
经典使用场景
在教育技术领域,Student_100数据集被广泛用于模拟不同认知水平学生的行为模式。通过构建基于知识图谱的认知原型,该数据集能够精确捕捉学生在Python编程任务中的知识掌握情况,从而生成具有真实错误模式的解决方案。这一方法为教育研究者提供了一种高效的工具,用于评估教学策略和智能辅导系统的有效性。
解决学术问题
Student_100数据集解决了当前大型语言模型在模拟学生行为时过度生成完美答案的局限性。通过引入认知原型和自优化方法,该数据集能够准确模拟学生在不同认知水平下的错误模式,包括语法错误和逻辑错误。这一突破为个性化学习路径设计和适应性评估提供了可靠的数据支持,显著提升了教育模拟的真实性和实用性。
实际应用
在实际应用中,Student_100数据集被用于开发智能辅导系统和自动化评估工具。教育机构利用该数据集模拟学生群体,优化课程设计并预测学习难点。在线编程平台则通过该数据集生成的错误模式,为学习者提供针对性的反馈和纠错建议,有效提升了编程教学的效果和学习体验。
数据集最近研究
最新研究方向
近年来,Student_100数据集在教育人工智能领域引起了广泛关注,特别是在基于大型语言模型(LLM)的学生认知模拟研究中。该数据集由100名学生的Python编程学习记录构成,包含5000条详细标注的任务解决记录,为模拟不同认知水平学生的学习行为提供了丰富的数据基础。研究热点集中在如何利用LLM准确模拟学生的不完美学习行为,包括典型错误和认知差异。最新研究提出了基于知识图谱的认知原型框架,通过训练无关的方法实现了对学生行为的精准预测和解决方案模拟,在模拟准确性上实现了100%的提升。这一突破对个性化教育、智能辅导系统评估以及教学策略优化具有重要意义,为教育AI领域提供了更真实、可解释的学生行为建模方法。
相关研究论文
  • 1
    Embracing Imperfection: Simulating Students with Diverse Cognitive Levels Using LLM-based Agents浙江大学计算机科学与技术学院, 浙江大学教育学院, 香港科技大学 · 2025年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

LIDC-IDRI

LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。

OpenDataLab 收录

China Groundgroundwater Monitoring Network

该数据集包含中国地下水监测网络的数据,涵盖了全国范围内的地下水位、水质和相关环境参数的监测信息。数据包括但不限于监测站点位置、监测时间、水位深度、水质指标(如pH值、溶解氧、总硬度等)以及环境因素(如气温、降水量等)。

www.ngac.org.cn 收录

CHIRPS v2.0

CHIRPS v2.0是一个全球降水数据集,提供高分辨率的降水估计,结合了卫星观测和气象站数据。数据集覆盖全球,时间范围从1981年至今,空间分辨率为0.05度。

www.chc.ucsb.edu 收录

VisDrone2019

VisDrone2019数据集由AISKYEYE团队在天津大学机器学习和数据挖掘实验室收集,包含288个视频片段共261,908帧和10,209张静态图像。数据集覆盖了中国14个不同城市的城市和乡村环境,包括行人、车辆、自行车等多种目标,以及稀疏和拥挤场景。数据集使用不同型号的无人机在各种天气和光照条件下收集,手动标注了超过260万个目标边界框,并提供了场景可见性、对象类别和遮挡等重要属性。

github 收录

PDT Dataset

PDT数据集是由山东计算机科学中心(国家超级计算济南中心)和齐鲁工业大学(山东省科学院)联合开发的无人机目标检测数据集,专门用于检测树木病虫害。该数据集包含高分辨率和低分辨率两种版本,共计5775张图像,涵盖了健康和受病虫害影响的松树图像。数据集的创建过程包括实地采集、数据预处理和人工标注,旨在为无人机在农业中的精准喷洒提供高精度的目标检测支持。PDT数据集的应用领域主要集中在农业无人机技术,旨在提高无人机在植物保护中的目标识别精度,解决传统检测模型在实际应用中的不足。

arXiv 收录