基于策略引导的数学应用题推理轨迹数据集SGRT-Math
收藏DataCite Commons2026-04-30 更新2026-05-05 收录
下载链接:
https://www.scidb.cn/detail?dataSetId=103a66c0b5ca41ff9ae560f2fd141529
下载链接
链接失效反馈官方服务:
资源简介:
以GSM8K训练集为种子数据来源,在保留原题数学逻辑内核不变的前提下,对题目进行现代场景改写,利用Planner-Reasoner双角色交互框架生成可直接用于策略学习和过程监督的推理轨迹。SGRT-Math以JSONL格式发布,包含20,324条样本,77.80MB。每条样本包含question、ground_truth、interaction_trace和final_answer 4个一级字段;推理角色Planner与Reasoner的推理策略交互为4至12轮次,平均7.24轮。
提供机构:
Science Data Bank
创建时间:
2026-04-22



