MCQ Dataset
收藏arXiv2025-01-10 更新2025-01-14 收录
下载链接:
https://zenodo.org/records/14284346
下载链接
链接失效反馈官方服务:
资源简介:
MCQ数据集由博洛尼亚大学的研究团队创建,包含162道与编程语言相关的多项选择题,旨在研究大型语言模型(LLMs)在教育领域的应用。数据集包括来自大学课程、教科书和公开网络资源的题目,并以JSON格式存储。每条数据包含问题、选项、正确答案、解释和主题字段。数据集的主要应用领域是教育,特别是编程语言课程,旨在通过微调LLMs来提高其回答多项选择题的准确性,从而减少资源消耗并提高教学效率。
The MCQ dataset was developed by a research team at the University of Bologna, comprising 162 multiple-choice questions related to programming languages, with the aim of investigating the applications of Large Language Models (LLMs) in the educational field. The dataset consists of questions sourced from university courses, textbooks, and public web resources, and is stored in JSON format. Each data entry contains fields including question, options, correct answer, explanation, and topic. Its core application scenario is education, particularly programming language courses, with the objective of fine-tuning LLMs to boost their accuracy in answering multiple-choice questions, thus reducing resource consumption and improving teaching efficiency.
提供机构:
博洛尼亚大学
创建时间:
2025-01-10
搜集汇总
数据集介绍

构建方式
MCQ数据集的构建基于162道本科编程语言课程的多项选择题,涵盖了来自大学课程、教材以及公开网络资源的题目。数据集以JSON格式组织,每个问题包含五个字段:问题文本、选项列表、正确答案标识、答案解析以及所属主题。通过这种方式,数据集不仅提供了丰富的题目内容,还确保了数据的结构化和可扩展性,便于后续的模型训练和评估。
特点
MCQ数据集的特点在于其多样性和针对性。数据集中的题目涵盖了编程语言课程的多个主题,且部分题目来自权威教材,确保了题目的专业性和准确性。此外,数据集的JSON格式设计使得每个问题都附有详细的答案解析和主题分类,便于模型在训练过程中理解题目的上下文和知识背景。这种结构化的设计为模型的微调和评估提供了坚实的基础。
使用方法
MCQ数据集的使用方法主要围绕模型的微调和评估展开。研究人员可以通过对数据集中的题目进行微调,提升模型在特定领域的表现。具体而言,数据集可用于训练和测试不同规模的LLM模型(如LLaMA-2的7B、13B和70B版本),并通过量化技术降低硬件资源需求。此外,数据集的JSON格式使得研究人员可以轻松地提取题目、选项和答案解析,进行模型推理和准确性评估,从而为教育领域的AI应用提供支持。
背景与挑战
背景概述
MCQ数据集由意大利博洛尼亚大学的研究团队于2025年创建,旨在探索大型语言模型(LLMs)在教育领域的应用潜力,特别是在回答编程语言课程相关的选择题(MCQs)方面的表现。该数据集包含162道本科级别的编程语言课程选择题,涵盖了从教科书、网络资源以及教师提供的题目。研究团队通过使用LLaMA-2模型的不同变体(7B、13B和70B),研究了模型在硬件限制和微调技术下的表现。研究结果表明,基于课程教材微调的小型模型在回答MCQs时表现优于未经微调的大型模型,从而为教育领域提供了一种资源高效且经济可行的解决方案。该数据集的开源性质使其成为教育技术研究的重要资源,推动了LLMs在教育中的应用研究。
当前挑战
MCQ数据集的研究面临多重挑战。首先,LLMs在回答MCQs时存在准确性问题,尤其是在处理特定领域的复杂问题时,模型容易产生错误答案。其次,构建数据集时,研究人员需要确保题目的多样性和代表性,以覆盖编程语言课程的多个主题。此外,微调过程中,如何有效利用有限的硬件资源(如消费者级GPU)来提升模型性能,也是一个关键挑战。研究团队通过量化技术和LoRA微调方法,减少了模型的内存占用,但仍需在准确性和资源消耗之间找到平衡。最后,如何避免微调过程中的灾难性遗忘现象,确保模型在获得新知识的同时不丢失原有的泛化能力,也是未来研究的重要方向。
常用场景
经典使用场景
MCQ数据集主要用于教育领域,特别是在编程语言课程中,帮助评估大型语言模型(LLMs)在回答多项选择题(MCQs)时的表现。通过对LLaMA-2等预训练模型进行微调,研究人员能够探索模型在特定学术主题上的准确性,尤其是在硬件资源有限的情况下。该数据集的使用场景涵盖了从模型微调到量化技术的多个方面,旨在提高模型在回答MCQs时的效率和准确性。
实际应用
MCQ数据集的实际应用场景主要集中在教育领域,特别是在编程语言课程的教学和评估中。通过使用该数据集,教师和学生可以更高效地进行学习和教学。微调后的LLMs能够生成个性化的学习体验,帮助教师设计测验并提供反馈。此外,该数据集还为教育机构提供了一种经济实惠的方式,利用较小的模型在资源有限的硬件上运行,从而推动AI技术在教育中的广泛应用。
衍生相关工作
MCQ数据集衍生了许多相关的研究工作,特别是在LLMs的微调和量化技术方面。例如,Bucher和Martini的研究表明,较小的微调模型在文本分类任务中表现优于较大的预训练模型。此外,Zhang等人的研究进一步探讨了LLMs在STEM领域的表现,强调了优化模型知识结构的重要性。MCQ数据集还为其他研究提供了基础,如Nori等人对GPT-4在医学考试中的表现评估,以及Silva等人对农业领域MCQs的研究。这些工作共同推动了LLMs在教育和其他领域中的应用。
以上内容由遇见数据集搜集并总结生成



