rspiocbis/Llama3.2-Mamba2-3B-distill-best_of_n-PRM-2019996
收藏Hugging Face2025-02-04 更新2025-02-15 收录
下载链接:
https://hf-mirror.com/datasets/rspiocbis/Llama3.2-Mamba2-3B-distill-best_of_n-PRM-2019996
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是针对GSM8k问题的训练集,包含问题和答案以及多种预测结果和评分。具体特征包括问题文本、答案文本、完成序列、分数、预测文本、完成标记序列、聚合分数以及不同预测策略下的预测结果。
This dataset is a training set for GSM8k questions, containing question texts, answer texts, completion sequences, scores, prediction texts, completion token sequences, aggregate scores, and predictions under different strategies.
提供机构:
rspiocbis



