GreekMMLU

Hugging Face2026-02-04 更新2026-02-05 收录

下载链接：

https://huggingface.co/datasets/dascim/GreekMMLU

下载链接

链接失效反馈

官方服务：

资源简介：

希腊MMLU Parquet数据集是一个用于评估和考试目的的多选题问答数据集，涵盖广泛的学术和专业领域。数据集包含50个不同的主题配置（如会计、农业、艺术、生物等），每个配置下分为测试集和开发集。数据字段包括问题、选项、答案、组别、主题和级别。数据集以希腊语为主，适用于多选题问答任务，支持对模型在希腊语学术和专业领域知识上的评估。

创建时间：

2026-01-26

原始信息汇总

Greek MMLU Parquet 数据集概述

基本信息

数据集名称: Greek MMLU Parquet
语言: 希腊语 (el)
许可证: MIT
主要任务类别: 问答、多项选择
标签: mmlu, greek, evaluation, exam

数据集结构

数据集包含多个配置（config），每个配置对应一个特定的学科或主题。每个配置均包含测试集（test）和开发集（dev）两个数据划分。

配置列表

数据集共包含57个配置，涵盖广泛的学科领域，包括但不限于：

会计学 (Accounting)
农业 (Agriculture_Professional, Agriculture_University)
艺术 (Art_Professional, Art_Secondary_School, Art_University)
生物学 (Biology)
化学 (Chemistry)
土木工程 (Civil_Engineering)
临床知识 (Clinical_Knowledge)
计算机科学 (Computer_Science_Professional, Computer_Science_University)
驾驶规则 (Driving_Rules)
经济学 (Economics_Professional, Economics_University)
教育学 (Education_Professional, Education_University)
电气工程 (Electrical_Engineering)
常识 (General_Knowledge)
地理学 (Geography_Primary_School, Geography_Secondary_School)
政府与政治 (Government_and_Politics_Primary_School, Government_and_Politics_Secondary_School)
希腊历史 (Greek_History_Primary_School, Greek_History_Professional, Greek_History_Secondary_School)
希腊文学 (Greek_Literature)
希腊神话 (Greek_Mythology)
希腊传统 (Greek_Traditions)
法律 (Law)
管理学 (Management_Professional, Management_University)
海事安全与救援行动 (Maritime_Safety_and_Rescue_Operations)
数学 (Mathematics)
医学 (Medicine_Professional, Medicine_University)
现代希腊语 (Modern_Greek_Language_Primary_School, Modern_Greek_Language_Secondary_School)
物理学 (Physics_Primary_School, Physics_Professional, Physics_University)
史前史 (Prehistory)
世界历史 (World_History)
世界宗教 (World_Religions)
综合 (All)

数据特征

每个配置的数据具有相同的特征结构：

question: 问题文本 (字符串类型)
choices: 选项列表 (字符串序列或列表)
answer: 正确答案索引 (int64类型)
group: 分组信息 (字符串类型)
subject: 学科主题 (字符串类型)
level: 难度级别 (字符串类型)

数据规模

数据集总规模（All配置）如下：

总下载大小: 3,653,532 字节
总数据集大小: 9,003,536 字节
总示例数: 16,857 (测试集 16,632 例，开发集 225 例)

各配置的具体规模（示例数、字节大小）详见提供的README文件。

搜集汇总

数据集介绍

构建方式

在希腊语自然语言处理领域，GreekMMLU数据集的构建体现了跨语言知识评估的严谨范式。该数据集以著名的MMLU（大规模多任务语言理解）框架为基础，通过系统化的翻译与本土化流程，将涵盖57个专业学科的原始英语试题转化为希腊语版本。构建过程不仅注重语言转换的准确性，更强调文化语境与教育体系的适配性，确保试题在希腊教育背景下保持专业性与适用性。每个学科配置均经过分层设计，包含测试集与开发集，为希腊语语言模型的评估提供了结构化基础。

使用方法

使用GreekMMLU进行模型评估时，研究者可通过HuggingFace平台直接加载特定学科配置或完整数据集。数据集采用标准化的Parquet格式，支持高效读取与处理。典型评估流程包括：加载开发集进行超参数调优，随后在测试集上执行多项选择题回答任务，通过准确率等指标量化模型性能。数据集的层级与学科标签支持细粒度分析，便于研究者探究模型在不同知识领域的表现差异。该资源适用于希腊语语言模型的基准测试、跨语言能力比较及教育技术应用开发。

背景与挑战

背景概述

在自然语言处理领域，多语言模型评估的标准化工具日益受到重视，GreekMMLU数据集应运而生，作为MMLU基准的希腊语版本，专注于评估模型在希腊语环境下的知识理解与推理能力。该数据集由研究团队基于开源协议构建，涵盖了从会计、农业到希腊历史、文学等57个专业与学术科目，共计超过16000道多项选择题，旨在系统检验模型在复杂学科知识上的表现。其创建顺应了多语言人工智能发展的趋势，为希腊语自然语言处理研究提供了关键的评估资源，推动了非英语语言模型在学术与专业场景中的应用探索。

当前挑战

GreekMMLU数据集致力于解决希腊语模型在广泛学科知识上的评估难题，其核心挑战在于如何准确衡量模型对专业术语、文化语境及复杂逻辑的理解深度。构建过程中，数据收集面临希腊语高质量教育资源的稀缺性，需确保题目在语言准确性与学科专业性上的双重标准。同时，数据标注需要领域专家参与，以保障答案的权威性与一致性，避免因文化差异或表述歧义导致的评估偏差。此外，数据集的学科覆盖广度与难度层次的平衡，也对模型评估的全面性与公平性提出了更高要求。

常用场景

经典使用场景

在自然语言处理领域，GreekMMLU数据集作为希腊语多学科知识评估的基准工具，其经典使用场景在于全面评估大型语言模型在希腊语环境下的理解和推理能力。该数据集覆盖了从会计、农业到计算机科学、医学等57个专业学科，通过多项选择题的形式，系统性地检验模型对复杂专业知识的掌握程度。研究人员利用这一数据集进行模型性能的横向对比，深入分析模型在不同学科领域的表现差异，从而揭示模型在跨学科知识融合与语言理解方面的潜在局限。

解决学术问题

GreekMMLU数据集有效解决了多语言人工智能研究中希腊语资源匮乏的核心问题，为评估非英语语言模型的认知能力提供了标准化工具。该数据集通过构建大规模、高质量的多学科希腊语问答对，填补了希腊语评估基准的空白，使得研究者能够系统探究语言模型在低资源语言上的知识迁移与泛化性能。其意义在于推动了多语言人工智能的公平性发展，促进了跨语言知识表示学习的研究，为构建真正全球化的智能系统奠定了数据基础。

实际应用

在实际应用层面，GreekMMLU数据集为希腊语教育科技和智能助手的开发提供了关键支持。教育机构可利用该数据集构建自适应学习系统，根据学生在不同学科的表现提供个性化辅导方案。同时，该数据集能够训练和优化希腊语智能客服、专业领域问答机器人，提升其在法律、医疗、工程等行业的服务准确性。此外，政府部门也可借助该数据集评估公民对驾驶规则、政治常识的掌握程度，为公共政策制定提供数据参考。

数据集最近研究