five

MathEval

收藏
arXiv2025-09-30 收录
下载链接:
https://github.com/math-eval/matheval
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个用于评估数学语言模型的基准数据集,它是专门为数学领域的SLM(特定语言模型)评估基准的一部分而设计的。该数据集的规模各异,其任务旨在对数学语言模型进行评估。

This dataset is a benchmark for evaluating mathematical language models, specifically designed as part of the evaluation benchmark for SLMs (Specific Language Models) in the mathematical domain. It has varying scales, with its tasks dedicated to evaluating mathematical language models.
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作