five

AceReason-Math

收藏
Hugging Face2025-06-03 更新2025-06-04 收录
下载链接:
https://huggingface.co/datasets/nvidia/AceReason-Math
下载链接
链接失效反馈
官方服务:
资源简介:
AceReason-Nemotron-14B是一个数学和代码推理模型,通过强化学习从DeepSeek-R1-Distilled-Qwen-14B模型开始训练。它在AIME 2024和AIME 2025等数学和代码推理任务上取得了显著的性能提升。该模型首先在仅包含数学提示的强化学习上进行训练,然后在仅包含代码提示的强化学习上进行训练,这种方法不仅提高了数学基准测试的性能,还提升了代码推理任务的性能。
提供机构:
NVIDIA
创建时间:
2025-06-03
搜集汇总
数据集介绍
main_image_url
构建方式
在数学推理领域,AceReason-Math数据集的构建采用了严谨的筛选策略。该数据集整合了NuminaMath和DeepScaler-Preview两大权威来源的4.9万道数学问题,通过系统化的过滤规则剔除了包含多子问题、选择题、判断题等不符合要求的内容,同时排除了冗长复杂答案及证明类题目,确保了数据质量的纯粹性与一致性。
特点
作为专为强化学习设计的数学推理数据集,AceReason-Math展现出高质量、可验证性及挑战性的核心特质。其题目涵盖广泛的数学概念,兼具深度与多样性,已成功应用于训练AceReason-Nemotron系列模型,并在AIME24和AIME25等国际数学评测中取得显著成果,体现了数据集在实际应用中的有效性。
使用方法
该数据集主要服务于基于大语言模型的强化学习研究,用户可通过HuggingFace平台直接加载数据用于模型训练与评估。配套的开源评估工具包支持标准化性能测试,研究者可参照已发布的模型配置复现实验流程,推动数学推理技术的迭代发展。
背景与挑战
背景概述
数学推理作为人工智能领域的核心研究方向,旨在提升模型解决复杂数学问题的能力。AceReason-Math数据集由NVIDIA研究团队于2025年6月发布,其构建基于NuminaMath和DeepScaler-Preview等高质量数学问题源,通过严格的筛选规则剔除不适宜数据,最终形成包含49,000道数学题目的资源库。该数据集专为强化学习训练设计,支撑了AceReason-Nemotron系列模型的开发,这些模型在AIME2024和AIME2025等国际数学评测中表现出色,推动了数学推理技术的前沿发展。
当前挑战
数学推理领域长期面临问题多样性与答案可验证性的双重挑战,传统数据集往往难以平衡题目难度与逻辑严谨性。AceReason-Math在构建过程中需克服数据源异构性,通过过滤多子问题、选择题等非标准形式,确保每道题目的独立性与解析透明度。同时,强化学习训练要求答案具备明确的正确性判断标准,这对数据标注的精确度提出了极高要求,需避免长证明或复杂图示干扰模型学习过程。
常用场景
经典使用场景
在数学推理模型的强化学习训练中,AceReason-Math数据集作为高质量的训练资源,被广泛应用于提升模型解决复杂数学问题的能力。该数据集通过筛选NuminaMath和DeepScaler-Preview中的数学问题,确保其具有可验证性和挑战性,适用于训练如AceReason-Nemotron等先进模型,这些模型在AIME等数学基准测试中表现出色。
衍生相关工作
基于AceReason-Math数据集,衍生出了如AceReason-Nemotron系列模型等经典工作。这些模型在数学推理领域取得了显著进展,例如在AIME2024和2025基准测试中达到领先水平,推动了强化学习在数学人工智能中的应用,并激发了后续研究对高质量数据集的进一步探索。
数据集最近研究
最新研究方向
在数学推理领域,AceReason-Math数据集正推动基于强化学习的大语言模型训练成为前沿热点。该数据集通过整合NuminaMath和DeepScaler-Preview的高质量数学问题,并应用严格筛选规则去除冗余内容,为模型提供了可验证且具挑战性的训练环境。其衍生的AceReason-Nemotron系列模型在AIME2024和AIME2025等权威数学基准测试中表现卓越,凸显了强化学习在复杂数学问题求解中的潜力。这一进展不仅加速了人工智能在学术评估场景的应用,也为多步骤推理任务的算法优化提供了重要范本,标志着数学教育技术与自适应学习系统的融合进入新阶段。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作