EduQG
收藏arXiv2022-10-12 更新2024-06-21 收录
下载链接:
https://github.com/hadifar/
下载链接
链接失效反馈官方服务:
资源简介:
EduQG是一个高质量的教育领域多格式选择题数据集,包含3,397个样本,涵盖多种类型的选择题及其答案和源文档。每个问题以正常和填空两种形式呈现,正确答案与源文档通过句子级标注链接。此外,903个问题附有根据布鲁姆分类法的认知复杂度级别。所有问题均由教育专家而非众包工作者生成,确保符合教育和学习标准。该数据集不仅适用于问题和干扰项生成,还可用于探索问题格式转换等新挑战。EduQG旨在为教育领域的研究和评估提供宝贵资源,支持问题生成等进一步研究。
EduQG is a high-quality multi-format multiple-choice question dataset in the educational domain, containing 3,397 samples covering diverse types of multiple-choice questions, their corresponding answers and source documents. Each question is presented in two formats: the normal version and the fill-in-the-blank version. The correct answers are linked to their source documents via sentence-level annotations. Additionally, 903 of the questions are annotated with their cognitive complexity levels based on Bloom's Taxonomy. All questions are generated by educational experts rather than crowdworkers, ensuring compliance with educational and learning standards. This dataset can be applied not only to question and distractor generation, but also to exploring new challenges such as question format conversion. EduQG aims to provide valuable resources for educational research and evaluation, supporting further research on tasks like question generation.
提供机构:
互联网技术与数据科学实验室(IDLab),根特大学-imec,比利时
创建时间:
2022-10-12
搜集汇总
数据集介绍

构建方式
在构建EduQG数据集的过程中,研究团队从OpenStax平台精心筛选了由教育专家编写的教材内容与配套问题。通过系统化的数据爬取与过滤,剔除了涉及数学推理的学科领域,最终保留了涵盖13本教材的3,397道高质量选择题。为确保数据的严谨性,团队设计了多阶段标注流程:首先由语言学专家对每道题目进行句子级答案定位,将正确答案与教材原文中的关键句精确关联;随后,通过人工转换生成每道题目的完形填空与常规疑问句双格式版本;最后,对部分题目标注了基于布鲁姆教育目标分类法的认知复杂度等级。这一构建过程融合了自动化检索与人工校验,确保了数据集在保持教育规范性的同时具备丰富的结构化信息。
特点
EduQG数据集的核心特点体现在其多维度教育适配性上。作为专为教育领域设计的高质量资源,其所有题目均由教育专家而非众包人员创建,确保了题目符合教学评估标准。数据集创新性地为每道题目提供了常规疑问句与完形填空双格式表述,这为研究不同题型对学习效果的影响提供了实证基础。此外,数据集中超过60%的问题需要基于多个句子进行推理,突破了传统数据集中答案仅依赖单一句子的局限,更贴近真实教学场景中综合性知识考察的需求。部分题目附带的布鲁姆分类法标签,使得研究者能够针对不同认知层级的题目进行模型性能分析,进一步增强了数据集在教育评估中的实用价值。
使用方法
EduQG数据集为教育自然语言处理研究提供了多任务实验平台。研究者可利用其进行问题生成模型的训练与评估,通过输入教材原文与正确答案,生成符合教育规范的疑问句。在干扰项生成任务中,模型可基于问题主干与正确答案,自动产生具有迷惑性的错误选项。数据集独特的双格式特性支持问题格式转换研究,例如将常规疑问句自动转化为完形填空句式。在模型开发过程中,建议采用章节级数据划分策略以避免知识泄露,并可结合多阶段微调方法,先在通用数据集上进行预训练,再使用EduQG进行领域适配。实验评估可综合运用BLEU、ROUGE等自动指标,并结合布鲁姆分类层级进行细粒度性能分析。
背景与挑战
背景概述
在自然语言处理与教育技术交叉领域,自动生成高质量教育评估题目一直是核心研究挑战。EduQG数据集由根特大学IDLab实验室的Amir Hadifar等研究人员于2021年构建,旨在解决现有问题生成数据集在专业性与教育适用性方面的不足。该数据集基于OpenStax开源教材平台,收录了3,397个由教育专家编写的多选题样本,涵盖常规与完形填空两种表述形式,并标注了布鲁姆分类法的认知复杂度层级。其创新性在于提供了句子级源文档标注与多格式问题对,为教育领域的问题生成、干扰项生成及格式转换研究建立了高质量基准。
当前挑战
EduQG致力于解决教育领域自动评估系统的核心难题:如何生成符合教学标准、具备认知层次区分度且与教材内容紧密关联的多选题。具体挑战体现在两方面:在领域问题层面,需突破传统数据集中题目局限于事实回忆的局限,生成能评估理解、应用等高阶认知能力的题目;在构建过程中,面临专业标注成本高昂、多句子推理题目标注一致性难以保证,以及数学推理与开放性问题的过滤等挑战。此外,如何保持干扰项的合理性与教育有效性,同时实现问题格式间的精准转换,亦是该数据集试图攻克的关键技术难点。
常用场景
经典使用场景
在自然语言处理与教育技术交叉领域,EduQG数据集为自动生成教育评估材料提供了关键资源。该数据集最经典的使用场景在于支持多项选择题的自动生成与干扰项设计,尤其适用于基于教材内容的题目构建。研究者可利用其包含的3397个高质量题目对,结合句子级标注的源文档,训练序列到序列模型以生成符合教育标准的题目。这种应用不仅提升了题目生成的效率,还确保了题目与教学内容的紧密关联,为自适应学习系统提供了可靠的数据基础。
解决学术问题
EduQG数据集有效解决了教育领域自动题目生成中的若干核心学术问题。传统数据集多由众包构建,缺乏教育专家参与,难以满足形成性评估的需求。EduQG通过教育专家生成的题目、句子级源文档标注以及布鲁姆分类法标签,为模型训练提供了高质量监督信号。该数据集使研究者能够探索题目格式转换、认知复杂度建模等新挑战,并推动生成题目在语义一致性与教育适切性方面的性能提升,弥补了现有资源在专业性与可信度方面的不足。
衍生相关工作
围绕EduQG数据集已衍生出多项经典研究工作,主要集中在教育领域题目生成的模型优化与评估框架构建。研究者基于该数据集开展了多阶段微调实验,证明了领域自适应训练对提升生成质量的显著效果。相关工作还探索了干扰项生成的并行解码策略、题目格式转换的双向建模,以及基于布鲁姆分类法的复杂度分析。这些研究不仅推动了T5等预训练模型在教育任务中的定制化应用,还为跨数据集性能比较建立了新基准,促进了教育自然语言处理向更专业化、可解释的方向发展。
以上内容由遇见数据集搜集并总结生成



