math-reasoning-10k
收藏Math-reasoning-10k 数据集概述
数据集摘要
该数据集包含从 NuminaMath-CoT 数据集中提取的前 10,000 个问题的推理路径/计划及其解决方案。每个条目包含一个数学问题和一个相应的推理计划,该计划概述了解决问题所需的步骤,但不实际解决问题。这种方法侧重于规划和推理,提供了一个结构化的路径来解决问题,而不是最终的解决方案本身。
该数据集非常适合用于训练推理模型,因为它强调结构化思维,并避免了在涉及完整问题解决的数据集中可能出现的大推理步骤问题。
- 作者: Aarush
- 来源: NuminaMath-CoT(前 10,000 个问题)
- 数据规模: 10,000 个推理路径、问题、解决方案
- 使用的模型: Qwen2.5-7B-Instruct(在我的测试中,它与更大的 Qwen 2.5 72b, 32b instruct 版本表现相同)
- 主要用途: 训练数学问题解决中的推理和规划模型
- 更大版本即将推出
- 开放反馈和建议
关键特性
- 推理/规划步骤与解决方案中的步骤一致: 推理/规划与解决方案不冲突。
- 推理路径结构: 每个条目提供了分解解决问题所需的步骤,重点在于推理和规划,而不是最终答案。
- 简化的推理步骤: 通过避免完整的问题解决,推理步骤保持可管理和专注于规划,这对于需要中间步骤进行推理任务的模型训练非常有用。
预期用途
- 监督微调: 该数据集可用于微调模型,使其在进行答案生成之前进行推理。
- 偏好对齐(DPO): 可用于对现有推理模型进行 DPO。
数据集结构
每个数据样本包含:
- 问题: 来自 NuminaMath-CoT 数据集的数学问题。
- 推理路径: 详细的逐步计划,概述了如何解决问题,但不实际解决它。
- 解决方案: NuminaMath-CoT 数据集中问题的解决方案。
示例
问题: 已知序列 ${a_n}$ 的前 $n$ 项和为 $S_n$,且 $S_n = 2^n a_n - 1$,求序列 ${frac{a_n}{a_{n+1}}}$ 的前 $n$ 项和,记为 $T_n =$ ____。
计划: 1. 从给定的序列 ${a_n}$ 的前 $n$ 项和的方程开始:$S_n = 2^n a_n - 1$。2. 写出前 $n-1$ 项和的方程:$S_{n-1} = 2^{n-1} a_{n-1} - 1$。3. 从 $S_n$ 的方程中减去 $S_{n-1}$ 的方程,以找到 $a_n$ 关于 $a_{n-1}$ 的表达式。4. 使用 $a_n$ 的表达式找到 $frac{a_n}{a_{n+1}}$。5. 求和序列 $sum_{i=1}^{n} left(2 - frac{1}{2^i} ight)$ 以找到 $T_n$。6. 简化 $T_n$ 的表达式以获得最终答案。
解决方案: 由于 $S_n = 2^n a_n - 1$,我们有 $S_{n-1} = 2^{n-1} a_{n-1} - 1 (n geqslant 2)$。从第一个方程减去第二个方程,我们得到:$a_n = 2^n a_n - 2^{n-1} a_{n-1} (n geqslant 2)$。简化后,我们得到:$frac{a_n}{a_{n+1}} = frac{2^{n+1} - 1}{2^n} = 2 - frac{1}{2^n}$。因此,$T_n = sum_{i=1}^{n} left(2 - frac{1}{2^i} ight) = 2n - sum_{i=1}^{n} frac{1}{2^i} = 2n + frac{1}{2^n} - 1$。因此,答案是:$oxed{T_n = 2n + frac{1}{2^n} - 1}$。为了找到答案,我们首先使用给定的方程找到 $frac{a_n}{a_{n+1}}$ 的表达式,然后使用几何级数求和公式计算 $T_n$。这个问题需要理解序列和级数,以及操作代数表达式的能力。
联系方式
您可以通过电子邮件联系我:aarushlikesllms@gmail.com




