five

EdNet

收藏
arXiv2021-10-31 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/2111.00419v1
下载链接
链接失效反馈
官方服务:
资源简介:
EdNet是由北京师范大学未来教育高精尖创新中心创建的大型教育数据集,包含超过13000万条学生互动数据,涵盖近80万名韩国学生的学习活动。该数据集记录了从问题解决到课程消费的多种学生行为,并具有四级层次结构。创建过程中,数据集通过AI辅导服务收集,旨在通过深度学习技术追踪和分析学生的知识状态,以提高教育质量和个性化学习体验。EdNet的应用领域主要集中在知识追踪模型的构建和解释,以及教育数据分析,旨在解决教育领域的个性化教学和学习效果评估问题。

EdNet is a large-scale educational dataset developed by the Advanced Innovation Center for Future Education, Beijing Normal University. It contains over 130 million student interaction records, covering learning activities of nearly 800,000 South Korean students. This dataset records diverse student behaviors ranging from problem-solving to course consumption, and features a four-level hierarchical structure. Collected via AI tutoring services during its development, it aims to track and analyze students' knowledge states through deep learning technologies to improve educational quality and personalized learning experiences. The application scenarios of EdNet mainly focus on the construction and interpretation of knowledge tracing models as well as educational data analysis, aiming to address issues related to personalized instruction and learning outcome assessment in the education field.
提供机构:
北京师范大学未来教育高精尖创新中心
创建时间:
2021-10-31
搜集汇总
数据集介绍
main_image_url
构建方式
EdNet数据集的构建采用了从AI辅导服务中收集的学生活动大数据,包含了超过780千名韩国学生在两年内产生的130百万次互动。数据集不仅记录了学生的解题活动,还包含了观看讲座等多样化的学生行为。在构建知识追踪模型时,研究团队使用了EdNet中的“KT1”子数据集,并对数据进行预处理,包括过滤掉技能标签不可用的互动和删除互动数量过少的用户,最终将长互动序列分割为长度为200的较短序列,以便于模型训练和解释任务。采用的LSTM模型能够有效处理学习者练习数据中的顺序和时间特征。
使用方法
使用EdNet数据集时,研究团队首先基于LSTM单元构建了知识追踪模型,并对模型进行了评估。在解释模型决策时,采用了后验解释方法,即层叠相关性传播(LRP)方法,分析输入特征的个体贡献。通过一致性实验和删除实验,研究者评估了解释结果的准确性和相关性,验证了该方法在EdNet数据集上的有效性。用户在使用该数据集时,应关注数据集的预处理步骤,以及如何利用LRP方法进行模型解释,从而提高模型的可解释性。
背景与挑战
背景概述
EdNet数据集,由韩国人工智能辅导服务收集的学生活动数据构成,是目前公开可用的最大规模的知识追踪模型数据集。该数据集涵盖了超过780,000名用户,记录了超过2年时间内近800,000名学生的130,000,000多条互动信息。EdNet数据集的层级结构将学生行为划分为四个级别,为构建知识追踪模型提供了丰富的信息。Deliang Wang、Yu Lu等研究人员在EdNet数据集上构建了深度学习知识追踪模型,并探索了解释模型预测的新方法,以期提高模型在实际应用中的可解释性。
当前挑战
研究背景下的挑战主要包括两个方面:一是EdNet数据集规模巨大,如何在大规模数据上有效地构建和解释深度学习知识追踪模型;二是如何处理EdNet数据集中的多技能标签问题,以及如何利用其层级结构信息设计更准确有效的解释方法。具体挑战包括:1) 在大规模数据集上保持模型解释性的有效性;2) 处理多技能标签带来的解释性问题;3) 利用层级结构信息提升模型解释的准确性和有效性。
常用场景
经典使用场景
EdNet数据集作为深度知识追踪模型的研究平台,其经典使用场景在于构建和解释深度学习模型。研究者通过对EdNet数据集的分析,采用长短期记忆网络(LSTM)构建了知识追踪模型,并运用层内相关性传播(LRP)方法对模型进行解释,以探究模型决策背后的贡献因素。这一过程不仅涉及对学习者知识状态的建模,还涉及对学习序列的时序特性进行捕捉,从而提高模型预测的准确性。
解决学术问题
EdNet数据集解决了深度知识追踪模型解释性问题这一学术研究难题。传统的深度学习模型往往被视为“黑箱”,其内部决策过程难以解释,这在实际应用中是一个重大障碍。EdNet数据集的应用,使得研究者能够通过LRP方法对模型进行后验解释,提高了模型的透明度和可信度,为教育评估和个性化学习提供了有力支持。
实际应用
在实际应用场景中,EdNet数据集可用于教育辅导服务,通过追踪和分析学生的学习行为,为教育者提供关于学生学习进度和知识掌握情况的详细反馈。此外,它还可以用于开发智能教育软件,通过数据驱动的个性化推荐,帮助学生更有效地学习。这些应用不仅优化了教育资源分配,也提升了学习者的学习体验。
数据集最近研究
最新研究方向
EdNet数据集的深度知识追踪模型解释性研究,关注模型在大型数据集上的解释性方法的有效性及新问题探索。
相关研究论文
  • 1
    Interpreting Deep Knowledge Tracing Model on EdNet Dataset北京师范大学未来教育高精尖创新中心 · 2021年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作