MARIO-Math-Reasoning/AlphaMath-Trainset

Name: MARIO-Math-Reasoning/AlphaMath-Trainset
Creator: MARIO-Math-Reasoning
Published: 2024-06-20 21:49:54
License: 暂无描述

Hugging Face2024-06-20 更新2024-06-25 收录

下载链接：

https://hf-mirror.com/datasets/MARIO-Math-Reasoning/AlphaMath-Trainset

下载链接

链接失效反馈

官方服务：

资源简介：

这是AlphaMath Almost Zero项目的第三轮训练数据，其解题过程是由模型在第二轮自动生成的，没有使用GPT或人工标注。数据集中的问答对是从GSM8k和MATH数据集的训练分割中提取的，并且包含了正例和负例，用于训练策略模型和价值模型。

提供机构：

MARIO-Math-Reasoning

原始信息汇总

数据集卡片 AlphaMath Almost Zero

这是AlphaMath Almost Zero: Process Supervision Without Process的第三轮训练数据。解决方案过程由第二轮模型自动生成，没有使用GPT或人工注释。

5,000+

优质数据集

54 个

任务类型

进入经典数据集