RoSchoolToUniQA

Hugging Face2025-03-09 更新2025-03-10 收录

下载链接：

https://huggingface.co/datasets/RoLLMHub/RoSchoolToUniQA

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含了罗马尼亚全国高中毕业考试（Baccalaureate）和大学入学考试中的选择题，共1200道题目，涵盖12个学科，每个学科100道题目。数据集旨在评估大型语言模型在理解这些标准化考试中涉及的不同主题方面的能力和推理能力。

创建时间：

2025-02-28

搜集汇总

数据集介绍

构建方式

RoSchoolToUniQA数据集的构建，基于罗马尼亚国家学士学位和大学入学考试的题目，旨在评估大型语言模型在理解各类学术主题问题及推理能力。数据集的构建过程包括从公开的考试材料存档中收集问题，使用Gemini 2.0 Flash工具进行数据提取，并对提取的数据进行人工审核和校正，以确保数据的准确性。

使用方法

使用RoSchoolToUniQA数据集时，用户可以根据提供的元数据进行数据拆分，所有数据均可作为测试集使用。数据集的每个实例都包含问题编号、问题文本、选项、年份、正确答案、来源、科目和标签等字段，用户可以根据这些字段对问题进行标识和分类，以适应不同的评估需求。

背景与挑战

背景概述

RoSchoolToUniQA数据集是在对大型语言模型（LLM）在罗马尼亚语中的表现进行评估的需求背景下创建的。该数据集的创建灵感来源于微软研究院，旨在通过罗马尼亚国家学士学位和大学入学考试的问题，来评估LLM理解各类学术主题并对其进行推理的能力。数据集涵盖了十二个学科，包含了1200个选择题，每个学科包含100个问题。这些问题均来自官方考试，并附带正确答案和丰富的元数据信息。RoSchoolToUniQA数据集自创建以来，为评估LLM在学术领域理解与推理方面的性能提供了一个重要的基准，对自然语言处理领域产生了显著影响。

当前挑战

RoSchoolToUniQA数据集在构建过程中面临了多项挑战。首先，数据收集需要从公开的考试材料存档中提取信息，这些材料主要以PDF格式存在，且包含文本和图片中的文本。其次，数据预处理和清洗过程中需要对文本进行标准化和结构化，处理诸如引号标准化、字母异体字规范化等问题。此外，数据集在确保问题多样性和避免冗余方面也进行了精心设计，例如移除重复的问题以保证每个问题只出现一次。当前，数据集在扩展性和覆盖范围上仍有提升空间，如包含更多年份的题目、增加新的学科领域等，以进一步提升其在学术评估中的适用性和准确性。

常用场景

经典使用场景

RoSchoolToUniQA数据集的典型应用场景在于评估大型语言模型在罗马尼亚语中对于不同学术主题的理解和推理能力。该数据集汇集了罗马尼亚全国学士学位和大学入学考试的问题，为研究人员提供了一种标准化的方法来测试模型在处理具有挑战性的学术内容时的表现。

解决学术问题

该数据集解决了如何准确评估LLM在处理特定语言和文化背景下的学术问题时的性能问题。通过包含十二个不同学科的问题，RoSchoolToUniQA为学术研究者提供了一个多元化的测试平台，有助于推动跨学科的语言模型评估技术的发展，对提升教育技术工具的质量和准确性具有重要意义。

实际应用

在实际应用中，RoSchoolToUniQA数据集可以用于开发辅助教育工具，如智能辅导系统，这些系统能够帮助学生在准备学士学位和大学入学考试时进行练习和复习。此外，它还可以用于改进在线学习平台中的自动评分系统，从而提供更加个性化的学习体验。

数据集最近研究