MathFusionQA

Name: MathFusionQA
Creator: 中国人民大学高灵人工智能学院, 上海人工智能实验室, 清华大学, 上海交通大学, 武汉大学计算机科学与技术学院
Published: 2025-03-20 23:00:41
License: 暂无描述

arXiv2025-03-20 更新2025-03-22 收录

下载链接：

https://github.com/QizhiPei/mathfusion

下载链接

链接失效反馈

官方服务：

资源简介：

MathFusionQA数据集是由中国人民大学高灵人工智能学院、上海人工智能实验室等机构提出的一个数学问题数据集。该数据集通过三种融合策略（顺序融合、平行融合和条件融合）从原有数学训练集中构建问题对，生成新的数学问题。这些问题涵盖了数学知识的基本关系和组成方面，旨在通过增强数学问题之间的逻辑联系来提升大型语言模型的数学推理能力。MathFusionQA数据集共有60000个样本，用于训练和评估数学问题解决模型。

The MathFusionQA dataset is a mathematical problem dataset proposed by institutions including the Gaoling School of Artificial Intelligence at Renmin University of China and the Shanghai AI Laboratory. It constructs question pairs and generates new mathematical problems from the original mathematical training corpus via three fusion strategies: sequential fusion, parallel fusion, and conditional fusion. These problems cover the basic relational and compositional aspects of mathematical knowledge, aiming to improve the mathematical reasoning capabilities of large language models by strengthening the logical connections between different mathematical problems. The MathFusionQA dataset contains a total of 60,000 samples, which are used for training and evaluating mathematical problem-solving models.

提供机构：

中国人民大学高灵人工智能学院, 上海人工智能实验室, 清华大学, 上海交通大学, 武汉大学计算机科学与技术学院

创建时间：

2025-03-20

搜集汇总

数据集介绍

构建方式

MathFusionQA数据集的构建基于MathFusion框架，该框架通过三种融合策略生成新的数学问题：顺序融合、并行融合和条件融合。顺序融合通过共享变量将两个相关问题的解决方案链接起来，模拟解题依赖关系；并行融合通过整合类比问题来增强概念理解，生成一个包含其共享数学本质的新问题；条件融合则基于特定上下文生成选择性问题，以增强推理的灵活性。首先从现有数据集中识别适合融合的问题对，然后应用这些融合策略生成新问题，并使用强大的语言模型生成相应的解决方案。最终生成的MathFusionQA数据集用于微调多个大型语言模型，如DeepSeekMath-7B、Mistral-7B和Llama3-8B。

特点

MathFusionQA数据集的特点在于其通过融合策略生成的数学问题具有高度的多样性和复杂性。顺序融合通过链式依赖关系增强了问题的连贯性，并行融合通过类比问题强化了概念理解，而条件融合则通过上下文选择性问题提升了推理的灵活性。这些融合策略不仅丰富了数据集的多样性，还使得模型能够更好地捕捉数学任务中的内在关系结构，从而在解决复杂的多步骤问题时表现出色。此外，MathFusionQA数据集在保持高数据效率的同时，显著提升了模型在多个数学推理基准测试中的表现，平均准确率提升了18.0个百分点。

使用方法

MathFusionQA数据集的使用方法主要包括将其用于微调大型语言模型，以提升其在数学推理任务中的表现。首先，用户可以选择不同的融合策略（顺序融合、并行融合或条件融合）生成新的数学问题，并将其与原始训练集结合，形成最终的MathFusionQA数据集。然后，使用该数据集对模型进行微调，通常采用标准的指令微调方法，训练多个epoch以确保模型充分学习数据集中的数学关系。微调后的模型可以在多个数学推理基准测试中进行评估，如GSM8K、MATH、CollegeMath等，以验证其在领域内和领域外的泛化能力。此外，MathFusionQA还可以与其他数据增强方法（如DART-Math）结合使用，以进一步提升模型的性能。

背景与挑战

背景概述

MathFusionQA数据集是由Qizhi Pei、Lijun Wu等研究人员于2025年提出的，旨在通过指令融合增强大语言模型（LLMs）在数学问题解决中的能力。该数据集的创建灵感来源于人类学习数学的过程，即通过系统性地接触相互关联的概念来提升数学能力。MathFusion框架通过三种融合策略（顺序融合、并行融合和条件融合）生成新的数学问题，从而增强模型的推理能力。实验结果表明，MathFusion在多个数学推理基准测试中显著提升了模型的准确性，尤其是在数据效率方面表现突出。该数据集对数学推理领域的研究具有重要影响，尤其是在如何通过数据增强提升LLMs的数学能力方面提供了新的思路。

当前挑战

MathFusionQA数据集在构建和应用过程中面临多重挑战。首先，数学问题的复杂性和多样性使得传统的单指令微调方法难以有效捕捉数学知识的内在关系结构。MathFusion通过融合策略生成的问题虽然增强了模型的推理能力，但如何确保生成的问题逻辑一致且具有足够的多样性仍然是一个难题。其次，数据集的构建依赖于强大的生成模型（如GPT-4o-mini），生成的问题和解决方案可能存在错误或模糊性，这增加了数据质量控制的难度。此外，尽管MathFusion在数据效率方面表现出色，但其生成的合成指令数量相对较少（仅45K），如何在更少的数据下进一步提升模型的泛化能力仍是一个挑战。最后，如何将MathFusion与其他数据增强方法（如DART-Math）有效结合，以进一步提升模型性能，也是未来研究的重要方向。

常用场景

经典使用场景

MathFusionQA数据集在数学推理领域具有广泛的应用，尤其是在大语言模型（LLMs）的数学问题解决能力提升方面。该数据集通过融合策略生成新的数学问题，帮助模型更好地理解数学概念之间的内在关系。经典使用场景包括在数学竞赛、教育评估和自动解题系统中，模型通过该数据集进行微调后，能够显著提升其在复杂数学问题上的推理能力。

实际应用

在实际应用中，MathFusionQA数据集被广泛用于教育技术领域，尤其是在智能辅导系统和自动解题工具中。通过该数据集微调的模型能够为学生提供个性化的数学问题解答和反馈，帮助他们在学习过程中更好地理解数学概念。此外，该数据集还被应用于数学竞赛的自动评分系统，能够快速准确地评估参赛者的解题能力，提升竞赛的公平性和效率。

衍生相关工作

MathFusionQA数据集衍生了一系列相关研究工作，尤其是在数学数据增强和模型微调领域。基于该数据集的研究工作包括MetaMath、WizardMath和DART-Math等，这些工作进一步探索了数学问题的生成和增强策略。此外，MathFusionQA还为其他领域的数据增强提供了新的思路，例如在自然语言处理中的文本生成和机器翻译任务中，类似的融合策略也被广泛应用，进一步推动了数据增强技术的发展。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集