mlfoundations-dev/OpenThinker-7B_1743585418_eval_f912

Name: mlfoundations-dev/OpenThinker-7B_1743585418_eval_f912
Creator: mlfoundations-dev
Published: 2025-04-02 09:29:45
License: 暂无描述

Hugging Face2025-04-02 更新2025-04-12 收录

下载链接：

https://hf-mirror.com/datasets/mlfoundations-dev/OpenThinker-7B_1743585418_eval_f912

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个评估数据集，包含了预计算的模型输出结果，用于评估模型在特定任务（如GPQADiamond）上的表现。数据集包含了平均准确率、测试次数以及每次测试中的问题和正确解答的数量。

This is an evaluation dataset containing precomputed model outputs for assessing the performance of a model on specific tasks (such as GPQADiamond). The dataset includes average accuracy, number of runs, and the count of questions and correct answers in each run.

提供机构：

mlfoundations-dev

5,000+

优质数据集

54 个

任务类型

进入经典数据集