mlfoundations-dev/DeepSeek-R1-Distill-Qwen-32B_1743609165_eval_0981

Name: mlfoundations-dev/DeepSeek-R1-Distill-Qwen-32B_1743609165_eval_0981
Creator: mlfoundations-dev
Published: 2025-04-02 16:33:36
License: 暂无描述

Hugging Face2025-04-02 更新2025-04-12 收录

下载链接：

https://hf-mirror.com/datasets/mlfoundations-dev/DeepSeek-R1-Distill-Qwen-32B_1743609165_eval_0981

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个包含数学问题解答模型预计算输出的数据集，用于评估模型在AIME24、AIME25、AMC23、MATH500、GPQADiamond和LiveCodeBench等任务上的表现。每个任务都有详细的准确度指标和多次运行的评估结果。

This dataset contains precomputed outputs of a math question answering model for evaluation on tasks such as AIME24, AIME25, AMC23, MATH500, GPQADiamond, and LiveCodeBench. Each task has detailed accuracy metrics and evaluation results from multiple runs.

提供机构：

mlfoundations-dev

5,000+

优质数据集

54 个

任务类型

进入经典数据集