meta-math/MetaMathQA

Hugging Face2023-12-21 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/meta-math/MetaMathQA

下载链接

链接失效反馈

资源简介：

MetaMathQA数据集是从GSM8K和MATH的训练集中增强得到的，且没有使用测试集的数据。每个数据项的原始问题都可以在`meta-math/MetaMathQA`中找到，这些数据项均来自GSM8K或MATH的训练集。

The MetaMathQA dataset is augmented from the training splits of GSM8K and MATH, without employing any data from their test sets. The original question corresponding to each data entry can be found in `meta-math/MetaMathQA`, and all these entries are exclusively derived from the training splits of GSM8K or MATH.

提供机构：

meta-math

原始信息汇总

数据集概述

数据来源

数据集名称: MetaMathQA
数据增强来源: 从GSM8K和MATH的训练集中增强得到。
测试集使用: 增强数据不包含任何来自测试集的内容。

模型训练

模型名称: MetaMath-Mistral-7B
基础模型: Mistral-7B
训练数据集: MetaMathQA
性能提升: 使用MetaMathQA数据集并将基础模型从llama-2-7B改为Mistral-7B，GSM8K性能从66.5提升至77.7。

实验结果

模型性能对比:
- MetaMath-Mistral-7B: GSM8K Pass@1为77.7，MATH Pass@1为28.2。
- 其他模型: 包括MPT-7B、Falcon-7B、LLaMA-1-7B等，详细性能数据见实验表格。

引用

文献引用: bibtex @article{yu2023metamath, title={MetaMath: Bootstrap Your Own Mathematical Questions for Large Language Models}, author={Yu, Longhui and Jiang, Weisen and Shi, Han and Yu, Jincheng and Liu, Zhengying and Zhang, Yu and Kwok, James T and Li, Zhenguo and Weller, Adrian and Liu, Weiyang}, journal={arXiv preprint arXiv:2309.12284}, year={2023} }

AI搜集汇总

数据集介绍

构建方式

MetaMathQA数据集的构建基于GSM8K和MATH训练集的增强，确保所有数据均来源于训练集而非测试集。通过这种方式，数据集旨在提供丰富的数学问题资源，以支持模型在数学推理任务中的训练。

特点

MetaMathQA数据集的显著特点在于其数据增强的来源可靠性，确保了数据集的高质量和适用性。此外，该数据集与Mistral-7B模型的结合显著提升了GSM8K任务的表现，从66.5提升至77.7，展示了其在数学推理任务中的强大潜力。

使用方法

使用MetaMathQA数据集时，用户可以通过替换提示模板中的{instruction}来构建自定义的数学问题。此外，数据集支持与Mistral-7B等模型的微调，建议使用较小的学习率进行训练，以优化模型性能。

背景与挑战

背景概述

MetaMathQA数据集由Longhui Yu等人于2023年创建，旨在通过增强GSM8K和MATH训练集的数据，提升数学问题解答的性能。该数据集的核心研究问题是如何通过自举生成数学问题，以增强大型语言模型在数学推理任务中的表现。MetaMathQA的构建不仅推动了数学问答领域的发展，还为模型微调提供了丰富的资源，特别是在提升GSM8K和MATH数据集上的表现方面。通过将MetaMathQA与Mistral-7B模型结合，研究人员成功将GSM8K的性能从66.5提升至77.7，显示出该数据集在数学推理任务中的显著影响力。

当前挑战

MetaMathQA数据集在构建过程中面临的主要挑战包括数据增强的复杂性和确保数据集的质量。首先，如何从GSM8K和MATH的训练集中有效增强数据，同时避免测试集的污染，是一个技术难题。其次，数据集的质量直接影响模型的性能，因此需要确保每个增强问题的准确性和合理性。此外，尽管MetaMathQA在提升模型性能方面表现出色，但其与不同基础模型的兼容性和微调策略仍需进一步研究和优化，以实现更广泛的应用和更高的性能提升。

常用场景

经典使用场景

MetaMathQA数据集在数学问答领域展现了其经典应用场景，主要用于增强和优化大型语言模型在数学推理任务中的表现。通过整合GSM8K和MATH训练集的数据，MetaMathQA为模型提供了丰富的数学问题和解答样本，使得模型在处理复杂数学问题时能够展现出更高的准确性和推理能力。

解决学术问题

MetaMathQA数据集解决了在数学教育与研究中常见的自动化解答和推理生成问题。通过提供高质量的数学问题和解答，该数据集帮助研究者训练出能够自动生成数学解答的模型，从而推动了数学教育技术的进步，并为相关领域的研究提供了新的工具和方法。

衍生相关工作

MetaMathQA数据集的发布催生了一系列相关研究和工作，包括基于该数据集的模型优化和扩展。例如，MetaMath-Mistral-7B模型的成功训练和应用展示了数据集在提升模型性能方面的潜力。此外，结合MathInstruct数据集的进一步研究也为数学教育领域的智能化发展提供了新的方向和可能性。

以上内容由AI搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集