mlfoundations-dev/OpenThinker-7B_eval_03-09-25_17-16_f912

Name: mlfoundations-dev/OpenThinker-7B_eval_03-09-25_17-16_f912
Creator: mlfoundations-dev
Published: 2025-03-09 16:29:34
License: 暂无描述

Hugging Face2025-03-09 更新2025-04-12 收录

下载链接：

https://hf-mirror.com/datasets/mlfoundations-dev/OpenThinker-7B_eval_03-09-25_17-16_f912

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个包含预计算模型输出的评估数据集，用于评估模型在GPQADiamond数据集上的表现。评估结果显示，平均准确率为27.95%，共进行了3次运行。

This is an evaluation dataset containing precomputed model outputs, used to assess the models performance on the GPQADiamond dataset. The evaluation results show an average accuracy of 27.95%, with a total of 3 runs conducted.

提供机构：

mlfoundations-dev

5,000+

优质数据集

54 个

任务类型

进入经典数据集