five

mothnaZl/Llama-3.1-8B-best_of_n-VLLM-Skywork-o1-Open-PRM-Qwen-2.5-7B-completions

收藏
Hugging Face2025-02-12 更新2025-02-15 收录
下载链接:
https://hf-mirror.com/datasets/mothnaZl/Llama-3.1-8B-best_of_n-VLLM-Skywork-o1-Open-PRM-Qwen-2.5-7B-completions
下载链接
链接失效反馈
官方服务:
资源简介:
这是一个关于数学任务的数据集,包含不同的配置,用于评估模型在数学任务上的表现。数据集特征包括问题数量(n)、朴素准确率(acc_naive)、加权准确率(acc_weighted)、多数投票准确率(acc_maj),以及在一些配置下的多样性指标(div_avg, div_sum, div_mean)。

This is a dataset for math tasks, containing different configurations to evaluate the performance of models on math tasks. The dataset features include the number of problems (n), naive accuracy (acc_naive), weighted accuracy (acc_weighted), majority vote accuracy (acc_maj), and diversity metrics (div_avg, div_sum, div_mean) in some configurations.
提供机构:
mothnaZl
二维码
社区交流群
二维码
科研交流群
商业服务