OpenR1-Math-220k

Hugging Face2025-02-11 更新2025-02-12 收录

下载链接：

https://huggingface.co/datasets/open-r1/OpenR1-Math-220k

下载链接

链接失效反馈

官方服务：

资源简介：

OpenR1-Math-220k是一个大规模的数学推理数据集，包含220k个数学问题和由DeepSeek R1生成的两个到四个推理轨迹。数据集分为默认和扩展两个部分，默认部分包含94k个问题，扩展部分包含131k个样本，后者引入了如cn_k12等额外数据源，提供了更多的推理轨迹。

创建时间：

2025-02-10

搜集汇总

数据集介绍

构建方式

OpenR1-Math-220k数据集的构建，是基于NuminaMath 1.5中的400k数学问题，利用DeepSeek R1模型生成解题过程。数据集的构建过程中，遵循模型卡片推荐的生成参数，并在用户提示中添加特定指令，以引导模型逐步推理并在答案中添加标记。每个问题生成两个或四个解题过程，以提供灵活的数据筛选和训练，同时支持拒绝采样和偏好优化方法。

特点

该数据集的特点在于其规模宏大，包含220k个数学问题及其解题过程，且经过Math Verify和Llama-3.3-70B-Instruct的验证，确保至少有一个正确答案的解题过程。数据集分为`default`和`extended`两个部分，后者引入了额外的数据源，尽管提供了更多的解题过程，但其性能在经过SFT后低于`default`部分。

使用方法

使用OpenR1-Math-220k数据集，可通过HuggingFace的datasets库加载。用户可以根据需要选择`default`或`extended`数据集部分。加载后，数据集可以直接用于数学推理模型的训练或评估。

背景与挑战

背景概述

OpenR1-Math-220k是一个大规模的数学推理数据集，由DeepSeek R1生成，旨在推动数学问题解决领域的研究。该数据集包含220k个数学问题，并为每个问题提供了两个到四个推理轨迹。这些轨迹经过Math Verify工具的验证，确保了答案的正确性。该数据集的创建，为研究人员提供了一个丰富的资源，以训练和评估数学推理模型，自发布以来，在数学教育和技术领域产生了显著影响。

当前挑战

该数据集面临的挑战主要包括：一是如何确保生成的数学推理轨迹的准确性和多样性，以满足不同的训练需求；二是数据集中包含的问题难度不一，导致在标准化的模型训练后性能表现有所差异，尤其是在使用cn_k12数据源时更为明显；三是构建过程中，如何高效地利用计算资源，以实现在有限时间内生成大量高质量的推理轨迹。

常用场景

经典使用场景

在数学推理研究领域，OpenR1-Math-220k数据集凭借其海量的数学问题及对应的推理轨迹，成为检验数学模型推理能力的重要资源。该数据集常被用于训练和评估数学推理模型，特别是在评估模型对于多步骤推理问题的处理能力上。

实际应用

在实际应用层面，OpenR1-Math-220k数据集可用于开发智能教育辅助系统，为学习者提供个性化的数学解题辅导。此外，它还可以被集成到在线学习平台中，通过自动化评估学生的解题过程，来优化学习体验。

衍生相关工作

基于OpenR1-Math-220k数据集，研究者们开展了一系列相关工作，如改进推理算法、开发新的评估指标以及探索适用于不同教育阶段的数学推理模型。这些研究进一步拓展了该数据集的应用范围，推动了数学教育技术的创新发展。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集