Reasoning Gym
收藏Reasoning Gym 数据集概述
数据集简介
Reasoning Gym 是一个用于训练推理模型的 Python 库,包含程序化数据集生成器和算法可验证的推理环境。该库的目标是通过强化学习(RL)生成具有可调复杂度的无限数据。
可用生成器
基础算术(Basic Arithmetic)
生成具有可配置复杂度的算术问题。
-
配置参数:
min_terms:表达式中的最小项数max_terms:表达式中的最大项数min_digits:每个数字的最小位数max_digits:每个数字的最大位数allow_parentheses:是否允许嵌套表达式size:生成的问题数量seed:用于可重复性
-
示例输出: python {question: -1 + -5 * 8 + -8 =, answer: -49, metadata: {num_terms: 4, num_digits: 1, expression: -1 + -5 * 8 + -8}} {question: 19 - 17 =, answer: 2, metadata: {num_terms: 2, num_digits: 2, expression: 19 - 17}}
链式求和(Chain Sum)
生成具有可配置复杂度的加法/减法问题。
-
配置参数:
min_terms:最小加减数max_terms:最大加减数min_digits:每个数字的最小位数max_digits:每个数字的最大位数allow_negation:是否允许负数size:生成的问题数量seed:用于可重复性
-
示例输出: python { "question": "426 + 562 =", "answer": "988", "metadata": { "num_terms": 2, "num_digits": 3, "expression": "426 + 562" }, }
序列补全(Sequence Completion)
生成具有动态模式生成的数字序列补全任务。
-
配置参数:
min_terms:最小可见项数max_terms:最大可见项数min_value:允许的最小数字max_value:允许的最大数字max_complexity:组合的最大操作数size:生成的序列数量seed:用于可重复性
-
示例输出: python { "question": "3, 6, 12, 24, 48, 96, 192, 384, ?", "answer": "768", "metadata": {"rule": "double", "complexity": 3, "sequence": [3, 6, 12, 24, 48, 96, 192, 384, 768]}, }
命题逻辑(Propositional Logic)
生成具有可配置复杂度的逻辑推理任务。
-
配置参数:
min_vars:最小变量数max_vars:最大变量数min_statements:最小给定语句数max_statements:最大给定语句数max_complexity:最大操作深度size:生成的问题数量seed:用于可重复性
-
示例输出: python { "question": "Given:
- R
- Q What can we conclude?", "answer": "(P ∨ Q)", "metadata": {"premises": ["R", "Q"], "variables": ["P", "Q", "R", "S"], "complexity": 3}, }
未来生成器计划
- 更复杂的数学任务(代数、几何)
- 算法任务(计数、排序、重新排序)
- 逻辑谜题
- 逻辑归纳编程任务
- ARC-AGI 合成谜题
贡献邀请
如果您有关于其他程序化数据集生成器的想法,请在此处创建问题或联系 GPU-Mode Discord 服务器的 #arc-agi-2 频道。




