MARIO-Math-Reasoning/AlphaMath-Trainset
收藏Hugging Face2024-06-20 更新2024-06-25 收录
下载链接:
https://hf-mirror.com/datasets/MARIO-Math-Reasoning/AlphaMath-Trainset
下载链接
链接失效反馈官方服务:
资源简介:
这是AlphaMath Almost Zero项目的第三轮训练数据,其解题过程是由模型在第二轮自动生成的,没有使用GPT或人工标注。数据集中的问答对是从GSM8k和MATH数据集的训练分割中提取的,并且包含了正例和负例,用于训练策略模型和价值模型。
这是AlphaMath Almost Zero项目的第三轮训练数据,其解题过程是由模型在第二轮自动生成的,没有使用GPT或人工标注。数据集中的问答对是从GSM8k和MATH数据集的训练分割中提取的,并且包含了正例和负例,用于训练策略模型和价值模型。
提供机构:
MARIO-Math-Reasoning
原始信息汇总
数据集卡片 AlphaMath Almost Zero
概述
这是AlphaMath Almost Zero: Process Supervision Without Process的第三轮训练数据。解决方案过程由第二轮模型自动生成,没有使用GPT或人工注释。



