arithmetic dataset

Name: arithmetic dataset
Creator: 伊利诺伊大学香槟分校电气与计算机工程学院
Published: 2025-02-18 21:43:06
License: 暂无描述

arXiv2025-02-18 更新2025-02-27 收录

下载链接：

https://anonymous.4open.science/r/reasoning-with-arith/README.md

下载链接

链接失效反馈

官方服务：

资源简介：

arithmetic dataset是一个程序生成的算术数据集，由伊利诺伊大学香槟分校电气与计算机工程学院的研究者Neeraj Gangwar, Suma P Bhat, Nickvash Kani在2023年的工作中使用。该数据集包含基本的算术运算问题，如加减乘除，以及分数和百分比问题，共约130万条示例。数据集的构建目的是为了增强小型模型在数学推理方面的能力，特别是通过算术训练来提高数学推理的准确性。

arithmetic dataset is a programmatically generated arithmetic dataset. It was developed and utilized by researchers Neeraj Gangwar, Suma P Bhat, and Nickvash Kani from the Department of Electrical and Computer Engineering, University of Illinois Urbana-Champaign in their 2023 research work. This dataset contains basic arithmetic operation problems including addition, subtraction, multiplication, division, as well as fraction and percentage-related questions, with approximately 1.3 million total examples. The dataset was constructed to enhance the mathematical reasoning capabilities of small-scale models, specifically to improve the accuracy of mathematical reasoning through arithmetic training.

提供机构：

伊利诺伊大学香槟分校电气与计算机工程学院

创建时间：

2025-02-18

搜集汇总

数据集介绍

构建方式

该数据集通过程序生成，涵盖了基本的算术运算，包括加法、减法、乘法和除法，并扩展到分数和百分比的问题。数据集中的例子数量约为130万个，并且限制了运算数中的数字位数，以确保计算的多样性而不过于复杂。通过这种生成方式，数据集能够为小规模模型提供充足的训练数据，从而提高它们在算术运算方面的能力。

特点

该数据集的特点在于其程序生成的方式，确保了数据的一致性和多样性。数据集中的算术问题涵盖了各种运算类型，且问题的难度适中，适合小规模模型进行训练。此外，数据集的规模适中，既能够提供足够的训练数据，又不会过于庞大导致训练效率低下。

使用方法

使用该数据集的方法主要有两种：中间微调和指令微调混合。在中间微调中，模型首先在算术数据集上进行微调，然后在其上训练推理数据集，以提高模型在算术运算方面的能力。在指令微调混合中，算术数据集被整合到指令微调的混合数据集中，使模型在学习一般指令遵循能力的同时，也能学习算术技能。通过这两种方法，模型可以在推理任务中更加准确地执行算术运算，从而提高其数学推理性能。

背景与挑战

背景概述

在自然语言处理（NLP）领域，尤其是在数学推理任务中，小模型往往因为训练数据不足而难以达到大型预训练模型的表现。为了解决这一问题，研究者们探索了多种方法，如知识蒸馏和数据增强。然而，这些方法在小模型上的应用效果并不理想，尤其是在算术计算方面。为了提高小模型在数学推理任务中的表现，Neeraj Gangwar等人提出了一种利用程序生成的算术数据集来增强小模型推理能力的方法。他们研究了两种关键方法：1）中间微调，即在推理数据集上训练之前，在算术数据集上微调模型；2）将算术数据集整合到指令微调混合中，使模型在学习和遵循一般指令的同时学习算术技能。实验结果表明，无论通过有针对性的微调还是指令微调混合，引入算术数据集都能提高模型的算术能力，进而改善其数学推理性能。

当前挑战

该数据集主要面临以下挑战：1）所解决的领域问题是数学推理，尤其是小模型在算术计算方面的不足；2）构建过程中遇到的挑战包括如何有效地将算术技能转移到推理任务中，以及如何避免过度优化模型在算术任务上的表现，从而影响其在其他任务上的表现。

常用场景

经典使用场景

在数学推理领域，该数据集的经典使用场景之一是作为小型模型的预训练数据。通过将算术数据集与推理数据集相结合，可以显著提升小型模型在数学推理任务上的表现。例如，模型可以先在算术数据集上进行微调，然后在推理数据集上进行训练，从而提高模型的数学推理能力。此外，算术数据集还可以整合到指令微调混合数据中，使模型在学习和执行通用指令的同时，掌握算术技能。

解决学术问题

该数据集解决了小型模型在数学推理任务上的性能不足问题。传统的预训练模型在处理数学推理任务时，由于训练数据量不足，难以捕捉数学推理的复杂性，导致推理能力较弱。而通过引入算术数据集，可以提供更多的训练示例，帮助模型更好地理解和处理数学推理任务，从而提高其推理能力。

衍生相关工作

该数据集衍生了多项相关的研究工作，例如针对小型模型的数学推理能力提升、算术数据集的生成方法、指令微调混合数据的设计等。这些研究工作为小型模型在数学推理任务上的应用提供了重要的理论基础和实践指导。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集