MMLU (Massive Multitask Language Understanding)

Name: MMLU (Massive Multitask Language Understanding)
Creator: OpenDataLab
Published: 2026-05-17 04:30:17
License: 暂无描述

OpenDataLab2026-05-17 更新2024-05-09 收录

下载链接：

https://opendatalab.org.cn/OpenDataLab/MMLU

下载链接

链接失效反馈

官方服务：

资源简介：

MMLU (大规模多任务语言理解) 是一种新的基准，旨在通过仅在零射击和少射击设置中评估模型来衡量预训练期间获得的知识。这使得基准测试更具挑战性，更类似于我们评估人类的方式。该基准涵盖了STEM，人文学科，社会科学等领域的57个主题。它的难度从初级水平到高级专业水平，它考验世界知识和解决问题的能力。学科范围从传统领域 (例如数学和历史) 到更专业的领域 (例如法律和道德)。对象的粒度和广度使基准成为识别模型盲点的理想选择。

提供机构：

OpenDataLab

创建时间：

2022-06-28

搜集汇总

数据集介绍