mlfoundations-dev/s1.1-32B_1743661958_eval_0981

Name: mlfoundations-dev/s1.1-32B_1743661958_eval_0981
Creator: mlfoundations-dev
Published: 2025-04-03 08:10:52
License: 暂无描述

Hugging Face2025-04-03 更新2025-04-12 收录

下载链接：

https://hf-mirror.com/datasets/mlfoundations-dev/s1.1-32B_1743661958_eval_0981

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集是预计算的模型输出，用于评估数学或数学相关任务的表现。它包含了AIME24、AIME25、AMC23、MATH500、GPQADiamond和LiveCodeBench等多个任务的结果，每个任务都有多次运行的详细准确度数据。

This dataset consists of precomputed model outputs for the evaluation of mathematical or math-related tasks. It includes results for multiple tasks such as AIME24, AIME25, AMC23, MATH500, GPQADiamond, and LiveCodeBench, each with detailed accuracy data from multiple runs.

提供机构：

mlfoundations-dev

5,000+

优质数据集

54 个

任务类型

进入经典数据集