TIGER-Lab/MathInstruct

Name: TIGER-Lab/MathInstruct
Creator: TIGER-Lab
Published: 2024-05-15 00:06:46
License: 暂无描述

Hugging Face2024-05-15 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/TIGER-Lab/MathInstruct

下载链接

链接失效反馈

官方服务：

资源简介：

MathInstruct是一个精心策划的指令调优数据集，专注于数学领域的链式思维（CoT）和程序化思维（PoT）的混合使用，并确保覆盖广泛的数学领域。该数据集由13个数学推理数据集编译而成，其中6个是本研究新策划的。

MathInstruct is a carefully curated instruction-tuning dataset focused on the hybrid application of Chain-of-Thought (CoT) and Program-of-Thought (PoT) in the mathematical domain, while ensuring coverage across a broad spectrum of mathematical fields. This dataset is compiled from 13 mathematical reasoning datasets, 6 of which are newly curated in this study.

提供机构：

TIGER-Lab

原始信息汇总

数据集概述

基本信息

名称: MathInstruct
许可证: MIT
任务类别: 文本生成
语言: 英语
大小类别: 100K<n<1M
标签: 数学

描述

MathInstruct是一个精心策划的指令调优数据集，轻量级且具有通用性。该数据集由13个数学推理数据集组成，其中6个为本次工作新策划。MathInstruct独特地专注于链式思维（CoT）和程序思维（PoT）推理的混合使用，并确保广泛覆盖多种数学领域。

许可证详情

GSM8K: MIT
GSM8K-RFT: 未列出
AQuA-RAT: Apache 2.0
MATH: MIT
TheoremQA: MIT
Camel-Math: Attribution-NonCommercial 4.0 International
NumGLUE: Apache-2.0
MathQA: Apache-2.0
Our Curated: MIT

引用信息

若使用该数据集、模型或代码，请引用以下论文：

@article{yue2023mammoth, title={MAmmoTH: Building Math Generalist Models through Hybrid Instruction Tuning}, author={Xiang Yue, Xingwei Qu, Ge Zhang, Yao Fu, Wenhao Huang, Huan Sun, Yu Su, Wenhu Chen}, journal={arXiv preprint arXiv:2309.05653}, year={2023} }

搜集汇总

数据集介绍

构建方式

在数学推理数据集构建领域，MathInstruct采用了一种精心设计的集成策略。该数据集从13个数学原理数据集中汇编而成，其中包含6个由本项目新近策划的数据源。其构建过程特别注重融合链式思维与程序化思维两种推理路径，旨在通过混合指令调优的方式，确保数据在数学各分支学科中具有广泛的覆盖度与代表性，从而支撑通用数学模型的训练。

特点

MathInstruct数据集展现出轻量化与强泛化能力的双重特性。作为指令调优数据集，它独特地整合了链式思维与程序化思维推理，这种混合设计增强了模型解决复杂数学问题的灵活性。数据集内容跨越多个数学领域，提供了丰富而多样的训练样本，为构建具备广泛数学理解能力的通用模型奠定了坚实基础。

使用方法

该数据集主要用于数学通用模型的指令调优阶段。研究人员可将其用于训练或微调大型语言模型，特别是基于Llama-2或Code Llama等架构的模型，以提升模型在数学推理与问题求解方面的性能。通过加载并处理该数据集中的指令-响应对，模型能够学习结合自然语言推理与代码生成来解决数学问题，相关预训练模型已在项目页面公开发布以供进一步研究与应用。

背景与挑战

背景概述

数学推理作为人工智能领域的关键挑战，其核心在于模型需具备严谨的逻辑推演与符号计算能力。MathInstruct数据集由TIGER-AI实验室于2023年构建，旨在通过混合指令微调策略培育通用数学专家模型。该数据集汇聚了13个数学原理数据集，其中6个为团队原创，聚焦于链式思维与程序化思维推理路径的融合，覆盖代数、几何、概率等多重数学分支，为提升大语言模型的数学泛化能力提供了高质量、轻量级的训练资源。

当前挑战

数学问题求解需模型跨越自然语言理解与形式化符号操作的双重障碍，传统方法常受限于单一推理模式，难以兼顾逻辑连贯性与计算精确性。数据集构建过程中，团队面临多源数据整合的复杂性，需统一异构数据格式并保证标注质量；同时，平衡链式思维与程序化思维样本的比例，以实现推理策略的有机杂交，亦是工程上的关键难点。此外，确保数据覆盖数学各子领域且避免偏差，对数据集的代表性与鲁棒性提出了更高要求。

常用场景

经典使用场景

在数学推理与通用人工智能交叉领域，MathInstruct数据集作为指令微调的关键资源，其经典使用场景聚焦于训练大型语言模型进行复杂数学问题求解。通过整合链式思维与程序化思维两种推理路径，该数据集引导模型在代数、几何、概率等多个数学分支上生成精确的解题步骤，有效提升了模型在数学任务上的泛化能力与逻辑严谨性。

衍生相关工作

基于MathInstruct衍生的经典工作包括MAmmoTH系列模型，这些模型以Llama-2和Code Llama为基座，通过混合指令微调实现了数学推理能力的突破。相关研究进一步探索了程序合成与自然语言推理的协同机制，催生了如定理自动证明、数学知识发现等一系列前沿方向，为后续数学大模型的研究奠定了方法论基础。

数据集最近研究