five

li-lab/MMLU-ProX

收藏
Hugging Face2025-08-26 更新2025-04-12 收录
下载链接:
https://hf-mirror.com/datasets/li-lab/MMLU-ProX
下载链接
链接失效反馈
官方服务:
资源简介:
MMLU-ProX是一个多语言基准测试,扩展了MMLU-Pro,覆盖了13种类型多样的语言。它旨在评估大型语言模型在不同语言和文化背景下的推理能力。数据集通过严格的半自动翻译过程和专家验证,确保了概念准确性、术语一致性和文化相关性。

MMLU-ProX is a multilingual benchmark that extends MMLU-Pro to cover 13 typologically diverse languages. It is designed to evaluate the reasoning capabilities of large language models across different linguistic and cultural backgrounds. The dataset ensures conceptual accuracy, terminological consistency, and cultural relevance through a rigorous semi-automatic translation process and expert validation.
提供机构:
li-lab
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作