DBE-KT22
收藏arXiv2023-01-28 更新2024-06-21 收录
下载链接:
https://dataverse.ada.edu.au/dataset.xhtml?persistentId=doi:10.26193/6DZWOH
下载链接
链接失效反馈资源简介:
DBE-KT22数据集是由澳大利亚国立大学计算学院创建,专注于数据库系统练习的知识追踪。该数据集包含167,222条记录,来源于在线学生练习系统,覆盖了2018至2021年间的学术数据。数据集详细记录了学生对问题的回答、时间、信心反馈等多维度信息,旨在解决在线教育中学生知识追踪的问题。通过提供丰富的元数据和关系图,DBE-KT22支持多种机器学习任务,如自然语言处理、图模型构建和认知分析,为智能教学系统的开发提供了重要资源。
The DBE-KT22 dataset was developed by the College of Engineering and Computer Science at the Australian National University, focusing on knowledge tracing for database system practice exercises. It contains 167,222 records sourced from an online student practice system, covering academic data from 2018 to 2021. The dataset comprehensively records multi-dimensional information such as students' answers to questions, response timestamps, confidence feedback and other relevant details, aiming to address the challenges of student knowledge tracing in online education. By providing rich metadata and relational graphs, the DBE-KT22 dataset supports a wide range of machine learning tasks including natural language processing, graph model construction and cognitive analysis, serving as a critical resource for the development of intelligent tutoring systems.
提供机构:
澳大利亚国立大学计算学院
创建时间:
2022-08-19
AI搜集汇总
数据集介绍

构建方式
DBE-KT22数据集是通过澳大利亚国立大学的一门关系数据库课程中在线学生练习系统的数据收集构建的。数据集收集了2018年至2021年期间本科生和研究生在多学科(包括计算机科学、工程、艺术和商业)中的练习回答历史。数据集的结构采用了关系模型,将每个数据方面分配到唯一的实体,并使用主外键对保持实体之间的关系。数据集包括问题的元数据,如标签文本、提示文本、选择文本和图像,以及涉及的学习概念的元数据,包括学习概念的标签文本和描述文本。此外,数据集还包含了学习概念之间以及学习概念和问题之间的关系的真值,以及由领域专家提供的关于问题难度的真值。数据集还记录了学生在回答问题时的不确定性,包括对问题难度的自我反馈、对答案的信心、使用提示的指示、改变答案次数以及回答问题所需的总时间。
特点
DBE-KT22数据集具有以下特点:1)提供了详细的问题元数据,包括标签文本、提示文本、选择文本和图像,为问题嵌入表示学习提供了多模态特征来源。2)提供了详细的学习概念元数据,包括学习概念的标签文本和描述文本,以便于学习代表性的学习概念嵌入。3)包含了学习概念之间以及学习概念和问题之间关系的真值,以图形的形式呈现,以促进图表示学习方法的利用。4)提供了由领域专家长期教授该课程提供的关于问题难度的真值,这为答案预测和评估量化问题难度的方法(如问题推荐和课程生成模型)提供了辅助特征。5)捕捉了学生在回答问题时反映不确定性的不同方面,包括对问题难度的自我反馈、对答案的信心、使用提示的指示、改变答案次数以及回答问题所需的总时间。
使用方法
DBE-KT22数据集可用于多种机器学习任务,例如:1)答案预测,基于学生的练习回答历史来预测学生正确回答后续问题的可能性。2)问题文本感知嵌入学习,使用问题文本数据来学习问题的嵌入表示,以便于进行相似性问题聚类和分类。3)基于问题与学习概念之间关系的图表示学习,使用图神经网络等方法来建模问题与学习概念之间的关系,以便于进行知识追踪和推荐系统。4)基于问题难度数据的课程学习,使用问题难度数据来生成个性化的课程和学习材料。5)基于学生在练习过程中记录的反馈数据的学习认知分析,以了解学生的学习过程和认知状态。数据集的访问和下载可以通过澳大利亚数据存档平台进行,并且提供了Python脚本以方便地生成训练序列和提取相关元数据。
背景与挑战
背景概述
在线教育在过去十年中日益重要,为全球学生提供负担得起的高质量教育。特别是在全球大流行期间,更多学生转向在线学习,这使得在线教育系统的重要性进一步凸显。在线教育任务,如课程推荐、练习推荐或自动评估,都依赖于跟踪学生的知识进步,这被称为知识追踪问题。解决这一问题需要收集能够反映学生知识随时间演变的评估数据。DBE-KT22数据集是从澳大利亚国立大学一门课程的学生在线练习系统中收集的,旨在解决这一问题。该数据集提供了详细的元数据,包括问题标签文本、提示文本、选项文本和图像,为问题嵌入表示学习提供了多模态特征源。此外,它还提供了关于学习概念之间以及学习概念与问题之间关系的真实数据,以促进图形表示学习方法的使用。DBE-KT22数据集对知识追踪领域产生了重大影响,为评估先进的深度知识追踪模型提供了重要的数据基础。
当前挑战
DBE-KT22数据集在解决知识追踪问题的过程中面临了一些挑战。首先,知识追踪问题本身就是一个具有层次动态系统的挑战,包括学习概念的个人熟练状态和学生的整体知识状态。其次,构建过程中所遇到的挑战包括收集真实世界的学生练习数据,并确保数据的准确性和可靠性。此外,数据集需要提供详细的元数据,包括问题标签文本、提示文本、选项文本和图像,以及学习概念标签文本和描述文本,以促进学习代表性学习概念嵌入。最后,数据集还需要包含学生回答问题时的不确定性方面的信息,包括对问题难度的自我反馈、对答案自信度的自我反馈、使用提示的指示、学生更改答案次数以及回答问题的总时间。这些挑战需要数据集开发者在数据收集、处理和分析方面进行深入的研究和探索。
常用场景
经典使用场景
DBE-KT22数据集基于数据库系统练习,主要用于在线教育系统中的知识追踪问题。其经典使用场景包括课程推荐、练习推荐和自动评估等。通过对学生练习回答历史数据的分析,该数据集可以追踪学生的知识进度,从而为在线教育系统提供个性化的学习体验。
衍生相关工作
DBE-KT22数据集的发布为知识追踪领域的研究提供了新的数据和工具。基于该数据集,研究人员可以开展各种研究,如自然语言处理、图表示学习、课程学习等。此外,该数据集还可以用于开发新的智能辅导系统和在线教育平台,为学生提供更加个性化的学习体验。
数据集最近研究
最新研究方向
DBE-KT22数据集的最新研究方向主要集中于知识追踪领域,特别是针对在线教育系统中的学生练习数据。这一数据集旨在通过收集反映学生知识随时间演变的评估数据,来解决知识追踪问题。DBE-KT22数据集的特点在于其提供了详细的元数据,包括问题的标签文本、提示文本、选项文本和图像,以及学习概念的标签文本和描述文本,为问题嵌入表示学习提供了多模态特征源。此外,该数据集还包含了学习概念之间的关系图,以及由领域专家提供的关于问题难度的真实数据,这为深度学习模型提供了辅助特征,可用于答案预测和评估方法。DBE-KT22数据集还捕捉了学生在回答问题时的不确定性,包括自我反馈的问题难度、对答案的自信程度、使用提示的指示、学生改变答案的次数以及回答问题所花费的总时间。这些特征不仅有助于量化答案的不确定性,还提供了关于学生练习行为的额外信息。因此,DBE-KT22数据集的研究方向不仅有助于评估先进的深度知识追踪模型,还为教育数据分析、个性化学习材料和课程生成等领域的机器学习任务提供了支持。
相关研究论文
- 1DBE-KT22: A Knowledge Tracing Dataset Based on Online Student Evaluation澳大利亚国立大学计算学院 · 2023年
以上内容由AI搜集并总结生成



