five

MMLU (Massive Multitask Language Understanding)

收藏
OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/MMLU
下载链接
链接失效反馈
官方服务:
资源简介:
MMLU (大规模多任务语言理解) 是一种新的基准,旨在通过仅在零射击和少射击设置中评估模型来衡量预训练期间获得的知识。这使得基准测试更具挑战性,更类似于我们评估人类的方式。该基准涵盖了STEM,人文学科,社会科学等领域的57个主题。它的难度从初级水平到高级专业水平,它考验世界知识和解决问题的能力。学科范围从传统领域 (例如数学和历史) 到更专业的领域 (例如法律和道德)。对象的粒度和广度使基准成为识别模型盲点的理想选择。
提供机构:
OpenDataLab
创建时间:
2022-06-28
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作