OpenR1-Math-220k
收藏Hugging Face2025-02-11 更新2025-02-12 收录
下载链接:
https://huggingface.co/datasets/open-r1/OpenR1-Math-220k
下载链接
链接失效反馈官方服务:
资源简介:
OpenR1-Math-220k是一个大规模的数学推理数据集,包含220k个数学问题和由DeepSeek R1生成的两个到四个推理轨迹。数据集分为默认和扩展两个部分,默认部分包含94k个问题,扩展部分包含131k个样本,后者引入了如cn_k12等额外数据源,提供了更多的推理轨迹。
创建时间:
2025-02-10
搜集汇总
数据集介绍

构建方式
OpenR1-Math-220k数据集的构建,是基于NuminaMath 1.5中的400k数学问题,利用DeepSeek R1模型生成解题过程。数据集的构建过程中,遵循模型卡片推荐的生成参数,并在用户提示中添加特定指令,以引导模型逐步推理并在答案中添加标记。每个问题生成两个或四个解题过程,以提供灵活的数据筛选和训练,同时支持拒绝采样和偏好优化方法。
特点
该数据集的特点在于其规模宏大,包含220k个数学问题及其解题过程,且经过Math Verify和Llama-3.3-70B-Instruct的验证,确保至少有一个正确答案的解题过程。数据集分为`default`和`extended`两个部分,后者引入了额外的数据源,尽管提供了更多的解题过程,但其性能在经过SFT后低于`default`部分。
使用方法
使用OpenR1-Math-220k数据集,可通过HuggingFace的datasets库加载。用户可以根据需要选择`default`或`extended`数据集部分。加载后,数据集可以直接用于数学推理模型的训练或评估。
背景与挑战
背景概述
OpenR1-Math-220k是一个大规模的数学推理数据集,由DeepSeek R1生成,旨在推动数学问题解决领域的研究。该数据集包含220k个数学问题,并为每个问题提供了两个到四个推理轨迹。这些轨迹经过Math Verify工具的验证,确保了答案的正确性。该数据集的创建,为研究人员提供了一个丰富的资源,以训练和评估数学推理模型,自发布以来,在数学教育和技术领域产生了显著影响。
当前挑战
该数据集面临的挑战主要包括:一是如何确保生成的数学推理轨迹的准确性和多样性,以满足不同的训练需求;二是数据集中包含的问题难度不一,导致在标准化的模型训练后性能表现有所差异,尤其是在使用cn_k12数据源时更为明显;三是构建过程中,如何高效地利用计算资源,以实现在有限时间内生成大量高质量的推理轨迹。
常用场景
经典使用场景
在数学推理研究领域,OpenR1-Math-220k数据集凭借其海量的数学问题及对应的推理轨迹,成为检验数学模型推理能力的重要资源。该数据集常被用于训练和评估数学推理模型,特别是在评估模型对于多步骤推理问题的处理能力上。
实际应用
在实际应用层面,OpenR1-Math-220k数据集可用于开发智能教育辅助系统,为学习者提供个性化的数学解题辅导。此外,它还可以被集成到在线学习平台中,通过自动化评估学生的解题过程,来优化学习体验。
衍生相关工作
基于OpenR1-Math-220k数据集,研究者们开展了一系列相关工作,如改进推理算法、开发新的评估指标以及探索适用于不同教育阶段的数学推理模型。这些研究进一步拓展了该数据集的应用范围,推动了数学教育技术的创新发展。
以上内容由遇见数据集搜集并总结生成



