nvidia/OpenMathInstruct-1
收藏Hugging Face2024-02-16 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/nvidia/OpenMathInstruct-1
下载链接
链接失效反馈官方服务:
资源简介:
OpenMathInstruct-1是一个包含180万个数学问题-解决方案对的数学指令调优数据集,使用Mixtral-8x7B模型生成。问题来源于GSM8K和MATH训练子集,解决方案通过混合文本推理和Python解释器执行的代码块生成。数据集分为训练和验证子集,包含多个字段如问题、生成解决方案、预期答案等。
OpenMathInstruct-1 is a mathematical instruction-tuning dataset containing 1.8 million math problem-solution pairs, generated using the Mixtral-8x7B model. The problems are sourced from the training subsets of GSM8K and MATH, while the solutions are generated by combining textual reasoning and code blocks executed via Python interpreters. The dataset is split into training and validation subsets, and includes multiple fields such as problem, generated solution, expected answer, and more.
提供机构:
nvidia
原始信息汇总
OpenMathInstruct-1 数据集概述
基本信息
- 许可证: NVIDIA License
- 任务类别:
- 问答
- 文本生成
- 语言: 英语
- 标签:
- 数学
- 代码
- NVIDIA
- 数据集名称: OpenMathInstruct-1
- 数据规模: 1M<n<10M
数据集描述
OpenMathInstruct-1 是一个数学指令调优数据集,包含 1.8M 个问题-解决方案对。这些问题来自 GSM8K 和 MATH 训练子集,解决方案由 Mixtral 模型通过文本推理和代码块执行合成生成。
数据集字段
- question: 来自 GSM8K 或 MATH 训练集的原始问题。
- generated_solution: 合成生成的解决方案,使用文本推理和代码块。
- expected_answer: 原始数据集中提供的标准答案。
- predicted_answer: Mixtral 模型预测的答案。
- error_message: 代码块执行时的错误信息,可能为
<not_executed>、空或包含 Python 异常。 - is_correct: 最终答案是否被评分脚本判定为正确。
- dataset: 数据来源,gsm8k 或 math。
- generation_type: 生成类型,
without_reference_solution或masked_reference_solution。
相关数据集
- GSM8K-Masked: 用于生成
masked_reference_solution部分的数据集。 - MATH-Masked: 用于生成
masked_reference_solution部分的数据集。
引用信息
bibtex @article{toshniwal2024openmath, title = {OpenMathInstruct-1: A 1.8 Million Math Instruction Tuning Dataset}, author = {Shubham Toshniwal and Ivan Moshkov and Sean Narenthiran and Daria Gitman and Fei Jia and Igor Gitman}, year = {2024}, journal = {arXiv preprint arXiv: Arxiv-2402.10176} }
搜集汇总
数据集介绍

构建方式
OpenMathInstruct-1数据集的构建,是基于GSM8K与MATH两个训练子集的问题-解决方案对,采用Mixtral-8x7B模型进行合成生成。该模型混合使用了文本推理和Python解释器执行的代码块,以生成解决方案。数据集分为训练集和验证集,两个子集联合涵盖了GSM8K和MATH的全部训练集。
特点
该数据集的特点在于其规模宏大,包含180万个问题-解决方案对,覆盖了广泛的数学问题。它不仅提供了原始问题和生成的解决方案,还包括了预期答案、模型预测答案、错误信息以及是否正确的标识。此外,数据集还提供了遮蔽解决方案的变体,以供进一步研究。
使用方法
使用OpenMathInstruct-1数据集时,用户可以访问问题、生成的解决方案、预期答案等字段,以进行数学指令微调任务的研究和模型训练。该数据集遵循NVIDIA许可,允许商业用途,用户可以通过遵循提供的使用指南和模型训练流程,来生成类似的数据集或复现研究成果。
背景与挑战
背景概述
OpenMathInstruct-1数据集,诞生于数学教育领域的研究需求,由NVIDIA公司的研究团队于2024年创建。该数据集的核心研究问题是提升数学指令调优模型的能力,其包含了1.8百万的问题-解决方案对,这些问题主要来源于GSM8K和MATH训练集,其解决方案则是通过结合文本推理和Python代码块的方式由Mixtral-8x7B模型生成。该数据集的发布,对数学教育相关领域的研究产生了显著影响,推动了数学问题解决模型的进步和发展。
当前挑战
在构建OpenMathInstruct-1数据集的过程中,研究团队面临了多重挑战。首先,如何精确地合成既有文本推理又有代码执行的解决方案,保证其既能被Python解释器正确执行,又能符合数学问题的实际解答,是一大挑战。其次,数据集在生成过程中,如何有效处理执行错误或超时问题,以及如何准确评估生成答案的正确性,也是构建过程中需要解决的重要问题。此外,所解决的领域问题,即如何通过数学指令调优,提高数学问题解决模型的性能,是该数据集需要应对的关键挑战。
常用场景
经典使用场景
在人工智能领域,特别是数学问题解答与文本生成任务中,OpenMathInstruct-1数据集以其庞大的问题解决方案对,为模型提供了丰富的训练资源。该数据集通过结合文本推理与代码块执行,模拟数学解题过程,成为研究数学指令微调的重要工具。
实际应用
在实际应用中,OpenMathInstruct-1数据集可以被用于开发数学助手,辅助教育领域的教学与学习。它能够帮助构建能够处理复杂数学问题的智能系统,为在线教育平台、智能家教等提供技术支持。
衍生相关工作
基于OpenMathInstruct-1数据集,研究者们已经开发出一系列OpenMath模型,这些模型在数学问题解答方面展现出优异的性能。这些相关工作不仅推动了数学教育领域的智能化进程,也为机器学习领域提供了新的研究方向和启示。
以上内容由遇见数据集搜集并总结生成



