five

MARIO-Math-Reasoning/AlphaMath-Trainset

收藏
Hugging Face2024-06-20 更新2024-06-25 收录
下载链接:
https://hf-mirror.com/datasets/MARIO-Math-Reasoning/AlphaMath-Trainset
下载链接
链接失效反馈
官方服务:
资源简介:
这是AlphaMath Almost Zero项目的第三轮训练数据,其解题过程是由模型在第二轮自动生成的,没有使用GPT或人工标注。数据集中的问答对是从GSM8k和MATH数据集的训练分割中提取的,并且包含了正例和负例,用于训练策略模型和价值模型。

这是AlphaMath Almost Zero项目的第三轮训练数据,其解题过程是由模型在第二轮自动生成的,没有使用GPT或人工标注。数据集中的问答对是从GSM8k和MATH数据集的训练分割中提取的,并且包含了正例和负例,用于训练策略模型和价值模型。
提供机构:
MARIO-Math-Reasoning
原始信息汇总

数据集卡片 AlphaMath Almost Zero

概述

这是AlphaMath Almost Zero: Process Supervision Without Process的第三轮训练数据。解决方案过程由第二轮模型自动生成,没有使用GPT或人工注释。

数据集详情

  1. 问题-答案对从GSM8kMATH的训练集中提取。
  2. 包含正例和负例,用于训练策略和价值模型。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作