PursuitOfDataScience/openmath-reasoning-medley

Name: PursuitOfDataScience/openmath-reasoning-medley
Creator: PursuitOfDataScience
Published: 2026-05-02 20:21:58
License: 暂无描述

Hugging Face2026-05-02 更新2026-04-12 收录

下载链接：

https://hf-mirror.com/datasets/PursuitOfDataScience/openmath-reasoning-medley

下载链接

链接失效反馈

官方服务：

资源简介：

OpenMath Reasoning Curated数据集是一个经过整理的数学问题解决方案生成数据集，来源于nvidia/OpenMathReasoning。该数据集保留了源数据集中的问题和预期答案，并添加了在整理过程中生成的解决方案。数据集包含多个分片，如链式思考推理示例（cot）和工具集成推理示例（tir），每个示例包含原始数学问题、生成的解决方案、预期答案、问题类型、问题来源、生成模型和令牌数量等信息。数据集还提供了详细的统计信息、生成模型的详细信息、数据格式、示例代码、分片描述、引用和许可证信息。

The OpenMath Reasoning Curated Dataset contains curated math-solution generations for problems from nvidia/OpenMathReasoning. The dataset preserves the problems and expected answers from the source dataset and adds generated solutions during curation runs. It includes multiple splits such as chain-of-thought reasoning examples (cot) and tool-integrated reasoning examples (tir). Each example contains the original math problem, generated solution, expected answer, problem type, problem source, generation model, and token count. The dataset also provides detailed statistics, generation model information, data format, example code, split descriptions, citations, and license information.

提供机构：

PursuitOfDataScience

原始信息汇总

数据集概述

数据集名称: OpenMath Reasoning Curated Dataset
数据集标识: PursuitOfDataScience/openmath-reasoning-medley

数据集来源

源数据集为 nvidia/OpenMathReasoning。
保留源数据集中的问题和预期答案。

数据集规模

指标	数值
数据总行数	4,097,950
总文件大小	62.8 GB
最近一月下载量	1,371

数据集构成

数据集包含以下子集（Split）：

子集名称	描述	数据行数	总Token数	平均Token数
cot	链式思维推理示例（Chain-of-thought）	3,201,343	46,264,123,688	14,451
tir	工具集成推理示例（Tool-integrated reasoning）	896,889	2,175,644,610	2,426
genselect	生成并选择的示例	-	-	-
additional_problems	额外多样化数学问题	-	-	-

总计: 4,098,232 条示例，48,439,768,298 个Token，平均 11,820 个Token/条。

数据字段

每条数据包含以下字段：

字段名	类型	描述
`idx`	int	源数据集中的索引
`problem`	str	原始数学问题
`generated_solution`	str	经过策展的模型输出，包含推理过程和最终解答
`expected_answer`	str	源数据集中的标准答案
`problem_type`	str	问题分类
`problem_source`	str	原始来源元数据
`generation_model`	str	生成该解答的具体模型标签
`num_tokens`	int	生成API报告的总Token使用量

数据格式

文件格式: parquet、optimized-parquet
数据模态: 表格（Tabular）、文本（Text）
语言: 英语（English）
数据量级: 1M - 10M 行

生成模型

用于生成解答的模型包括：

MiniMax-M2.1、MiniMax-M2.5、MiniMax-M2.7
deepseek/deepseek-v4-flash
inclusionai/ling-2.6-1t
mimo-v2.5-pro
mistral-large-latest（已解析为 mistral-large-2512）
nvidia/NVIDIA-Nemotron-3-Nano-30B

输出格式

解答采用 <think>...</think> 包裹逐步推理过程，后接最终解答。
MiMo-v2.5-pro 记录使用原生 thinking 块（预算 120K Token），在策展时序列化为 <think>...</think> 标签。

任务标签

任务: 文本生成（Text Generation）、问答（Question Answering）
标签: math、reasoning、chain-of-thought、Synthetic、problem-solving、mathematics

许可证

Apache 2.0 License。源问题和预期答案保留归属于 NVIDIA 的 OpenMathReasoning 数据集。

引用

bibtex @misc{openmath-reasoning-curated, title = {OpenMath Reasoning Curated Dataset}, author = {PursuitOfDataScience}, year = {2026}, publisher = {HuggingFace}, howpublished = {url{https://hf-mirror.com/datasets/PursuitOfDataScience/openmath-reasoning-medley}} }

@misc{nvidia-openmathreasoning, title = {OpenMathReasoning}, author = {NVIDIA}, year = {2024}, publisher = {HuggingFace}, howpublished = {url{https://hf-mirror.com/datasets/nvidia/OpenMathReasoning}} }

搜集汇总

数据集介绍

构建方式

在数学推理领域，数据集的构建质量直接影响模型性能的评估。OpenMath Reasoning Curated数据集以NVIDIA的OpenMathReasoning为源数据集，保留了原始数学问题及其标准答案。通过调用多个先进的大语言模型，包括MiniMax-M2系列、mistral-large-latest以及NVIDIA-Nemotron-3-Nano-30B等，为每个问题生成了详细的推理过程解答。生成过程中，模型输出被格式化为包含逐步推理的思考链，并封装在特定标签内，同时记录了生成模型的具体标识和所用令牌数量。在数据上传前，系统自动过滤了存在错误或解答为空的数据条目，确保了数据集的完整性与可靠性。

使用方法

对于希望利用该数据集的研究者而言，其使用流程清晰而便捷。通过Hugging Face的datasets库，用户可以直接加载整个数据集或指定加载链式思维推理等特定子集。加载后，每个数据条目以字典形式呈现，包含问题描述、模型生成的完整解答、标准答案、问题类型及生成模型等关键字段。用户可以通过分析generated_solution字段来研究模型的推理路径，或结合expected_answer进行答案正确性验证。该数据集适用于训练或评估能够进行复杂数学推理的模型，尤其适合用于思维链提示、解决方案生成以及多模型推理能力对比等前沿研究场景。

背景与挑战

背景概述

OpenMath Reasoning Curated数据集由PursuitOfDataScience团队于2026年构建，其核心源于NVIDIA在2024年发布的OpenMathReasoning数据集。该数据集专注于数学推理领域，旨在通过大规模生成并精选的链式思维与工具集成推理示例，推动人工智能在复杂数学问题求解方面的发展。其构建依托于MiniMax、Mistral及NVIDIA Nemotron等先进语言模型，生成了超过360万条高质量数学解题步骤，为研究数学推理的模型训练与评估提供了关键资源，显著促进了可解释人工智能与自动推理技术的进步。

当前挑战

该数据集致力于应对数学自动推理中的核心挑战，即如何让模型不仅输出正确答案，更能生成清晰、连贯且符合逻辑的逐步推理过程。这要求模型具备深层次的数学概念理解与符号操作能力。在构建过程中，挑战主要集中于确保生成解决方案的质量与多样性，需通过多模型协同与严格过滤来排除错误或空白的输出，同时精确追踪每个示例的生成模型与令牌使用情况，以维护数据集的可靠性与可复现性。

常用场景

经典使用场景

在数学推理与人工智能交叉领域，OpenMath Reasoning Curated数据集为研究者提供了丰富的链式思维与工具集成推理范例。该数据集通过精心策划的数学问题及其逐步解答，成为训练和评估大型语言模型数学推理能力的核心资源。其经典应用场景包括引导模型生成结构化推理过程，从而深化对复杂数学概念的理解与问题解决策略的掌握。

解决学术问题

该数据集有效应对了数学推理研究中模型缺乏透明推理路径与逻辑一致性的挑战。通过提供海量标注的思维链数据，它助力于探索模型如何从问题陈述中衍生出连贯的数学论证，并验证最终答案的正确性。其意义在于推动了可解释人工智能的发展，为评估模型在数学领域的泛化能力与鲁棒性设立了新基准。

实际应用

在实际应用层面，该数据集支撑了智能教育系统与自动化解题工具的构建。教育科技领域可借助其丰富的推理示例，开发能够提供个性化分步指导的数学辅导平台。同时，它也为金融分析、工程计算等需要严谨数学推导的行业提供了测试与优化专用模型的数据基础，提升了自动化系统的可靠性与效率。

数据集最近研究