M3KE(Massive Multi-Level Multi-Subject Knowledge Evaluation )
收藏OpenXLab2026-04-18 收录
下载链接:
https://openxlab.org.cn/datasets/OpenDataLab/M3KE
下载链接
链接失效反馈官方服务:
资源简介:
M3KE,一种大规模的多层次多学科知识评估基准,它是为测量中文大型语言模型在零和少镜头设置下获得的知识而开发的。我们从71个任务中收集了20,477个问题。我们的选择涵盖了从小学到大学的中国教育体系的所有主要层次,以及各种学科,包括人文,历史,政治,法律,教育,心理,科学,技术,艺术和宗教。所有问题都是选择题,有四个选项,因此保证了标准化和统一的评估过程。
我们已经评估并将继续评估我们基准上的许多中文大型语言模型。当前评估的模型要么仅对海量数据进行预训练,要么使用SFT或RLHF进行预训练微调。模型大小从335M到175B参数不等。
提供机构:
OpenDataLab
创建时间:
2023-09-04



