OpenR1-Math-Raw

Hugging Face2025-02-24 更新2025-02-25 收录

下载链接：

https://huggingface.co/datasets/open-r1/OpenR1-Math-Raw

下载链接

链接失效反馈

官方服务：

资源简介：

OpenR1-Math-Raw是一个大规模的数学推理数据集，包含516,499个数学问题，以及1,209,403个由DeepSeek R1生成的解决方案。每个问题平均有2.3个解决方案。解决方案经过Math Verify和LLM-as-Judge验证。数据集还包含了使用LLama-3.3-70B-Instruct重新解析的答案。

创建时间：

2025-02-12

搜集汇总

数据集介绍

构建方式

OpenR1-Math-Raw数据集的构建，源自于AI-MO/NuminaMath-1.5的516,499个数学问题，并利用DeepSeek R1生成了1至8个推理轨迹。数据集的构建过程中，仅保留了符合16k令牌预算的解决方案，并遵循了特定的<think>...</think>推理格式。同时，排除了NuminaMath-1.5中的合成问题，确保了数据集的质量与实用性。

特点

该数据集的特点在于其规模宏大，包含了丰富的数学推理问题及其解决方案。解决方案的平均数量为每个问题2.3个，且通过Math Verify和LLaMA Verification两种方式对重新解析的答案进行了验证，确保了答案的准确性。此外，数据集还提供了重新解析的答案列，以及包含验证结果的正确性列，为研究者提供了更为全面的数据支持。

使用方法

用户可以通过HuggingFace的datasets库加载OpenR1-Math-Raw数据集，使用split参数指定数据集的划分，例如加载训练集可通过指定split='train'。数据集加载后，用户可以访问问题、解决方案、答案、问题类型、问题有效性、解决方案有效性等字段，以及利用数据集中的验证结果进行进一步的研究与分析。

背景与挑战

背景概述

OpenR1-Math-Raw数据集，作为数学推理领域的大规模数据集，其创建旨在推进数学问题解决算法的发展与应用。该数据集由AI-MO/NuminaMath-1.5提供的问题构成，并包含由DeepSeek R1生成的1至8条推理轨迹。其创建时间为未明确指出，但可推断是在Math Verify和LLaMA-3.3-70B-Instruct等工具发展之后。主要研究人员或机构未直接提及，但涉及的数据集和工具表明，此数据集可能由多个研究团队协作完成。该数据集的核心研究问题聚焦于数学问题解决的推理过程及其准确性验证。其对相关领域的影响力体现在为机器学习模型，尤其是数学推理模型，提供了丰富的训练和测试资源。

当前挑战

在数据集构建过程中，研究人员面临了多项挑战。首先，保证解决方案的准确性和合理性需要复杂的验证过程，包括Math Verify和LLaMA-3.3-70B-Instruct的运用。其次，数据集的构建需处理大量的数据，保持问题与解决方案的一致性，并确保在16k-token预算内呈现推理过程。此外，针对非合成问题的筛选和后处理，也是保证数据质量的关键步骤。在领域问题上，OpenR1-Math-Raw数据集面临的挑战包括提高数学推理模型的准确性，处理多样化的数学问题，以及确保模型在不同复杂度问题上的泛化能力。

常用场景

经典使用场景

在数学推理研究领域，OpenR1-Math-Raw数据集的典型应用场景是作为数学问题生成与解决的训练素材。该数据集提供了大量数学问题及其对应的解题步骤，可供研究者在构建数学推理模型时进行学习和优化，进而提升模型的解题能力和准确性。

解决学术问题

OpenR1-Math-Raw数据集有效解决了数学推理研究中数据不足和多样性不足的问题。通过提供丰富的数学问题和解决方案，该数据集助力研究者深入探索数学推理的复杂性，并评估模型的性能，从而推动数学推理领域的学术研究进展。

衍生相关工作

基于OpenR1-Math-Raw数据集，研究者们已经开展了一系列相关工作，包括构建数学推理模型、开发自动评分系统、以及探究数学问题解决过程中的认知机制等。这些工作不仅推动了数学教育技术的发展，也为数学认知科学领域提供了新的研究方向和工具。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集