five

nvidia/OpenMathInstruct-1

收藏
Hugging Face2024-02-16 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/nvidia/OpenMathInstruct-1
下载链接
链接失效反馈
资源简介:
OpenMathInstruct-1是一个包含180万个数学问题-解决方案对的数学指令调优数据集,使用Mixtral-8x7B模型生成。问题来源于GSM8K和MATH训练子集,解决方案通过混合文本推理和Python解释器执行的代码块生成。数据集分为训练和验证子集,包含多个字段如问题、生成解决方案、预期答案等。
提供机构:
nvidia
原始信息汇总

OpenMathInstruct-1 数据集概述

基本信息

  • 许可证: NVIDIA License
  • 任务类别:
    • 问答
    • 文本生成
  • 语言: 英语
  • 标签:
    • 数学
    • 代码
    • NVIDIA
  • 数据集名称: OpenMathInstruct-1
  • 数据规模: 1M<n<10M

数据集描述

OpenMathInstruct-1 是一个数学指令调优数据集,包含 1.8M 个问题-解决方案对。这些问题来自 GSM8K 和 MATH 训练子集,解决方案由 Mixtral 模型通过文本推理和代码块执行合成生成。

数据集字段

  • question: 来自 GSM8K 或 MATH 训练集的原始问题。
  • generated_solution: 合成生成的解决方案,使用文本推理和代码块。
  • expected_answer: 原始数据集中提供的标准答案。
  • predicted_answer: Mixtral 模型预测的答案。
  • error_message: 代码块执行时的错误信息,可能为 <not_executed>、空或包含 Python 异常。
  • is_correct: 最终答案是否被评分脚本判定为正确。
  • dataset: 数据来源,gsm8k 或 math。
  • generation_type: 生成类型,without_reference_solutionmasked_reference_solution

相关数据集

  • GSM8K-Masked: 用于生成 masked_reference_solution 部分的数据集。
  • MATH-Masked: 用于生成 masked_reference_solution 部分的数据集。

引用信息

bibtex @article{toshniwal2024openmath, title = {OpenMathInstruct-1: A 1.8 Million Math Instruction Tuning Dataset}, author = {Shubham Toshniwal and Ivan Moshkov and Sean Narenthiran and Daria Gitman and Fei Jia and Igor Gitman}, year = {2024}, journal = {arXiv preprint arXiv: Arxiv-2402.10176} }

搜集汇总
数据集介绍
main_image_url
构建方式
OpenMathInstruct-1数据集的构建,是基于GSM8K与MATH两个训练子集的问题-解决方案对,采用Mixtral-8x7B模型进行合成生成。该模型混合使用了文本推理和Python解释器执行的代码块,以生成解决方案。数据集分为训练集和验证集,两个子集联合涵盖了GSM8K和MATH的全部训练集。
特点
该数据集的特点在于其规模宏大,包含180万个问题-解决方案对,覆盖了广泛的数学问题。它不仅提供了原始问题和生成的解决方案,还包括了预期答案、模型预测答案、错误信息以及是否正确的标识。此外,数据集还提供了遮蔽解决方案的变体,以供进一步研究。
使用方法
使用OpenMathInstruct-1数据集时,用户可以访问问题、生成的解决方案、预期答案等字段,以进行数学指令微调任务的研究和模型训练。该数据集遵循NVIDIA许可,允许商业用途,用户可以通过遵循提供的使用指南和模型训练流程,来生成类似的数据集或复现研究成果。
背景与挑战
背景概述
OpenMathInstruct-1数据集,诞生于数学教育领域的研究需求,由NVIDIA公司的研究团队于2024年创建。该数据集的核心研究问题是提升数学指令调优模型的能力,其包含了1.8百万的问题-解决方案对,这些问题主要来源于GSM8K和MATH训练集,其解决方案则是通过结合文本推理和Python代码块的方式由Mixtral-8x7B模型生成。该数据集的发布,对数学教育相关领域的研究产生了显著影响,推动了数学问题解决模型的进步和发展。
当前挑战
在构建OpenMathInstruct-1数据集的过程中,研究团队面临了多重挑战。首先,如何精确地合成既有文本推理又有代码执行的解决方案,保证其既能被Python解释器正确执行,又能符合数学问题的实际解答,是一大挑战。其次,数据集在生成过程中,如何有效处理执行错误或超时问题,以及如何准确评估生成答案的正确性,也是构建过程中需要解决的重要问题。此外,所解决的领域问题,即如何通过数学指令调优,提高数学问题解决模型的性能,是该数据集需要应对的关键挑战。
常用场景
经典使用场景
在人工智能领域,特别是数学问题解答与文本生成任务中,OpenMathInstruct-1数据集以其庞大的问题解决方案对,为模型提供了丰富的训练资源。该数据集通过结合文本推理与代码块执行,模拟数学解题过程,成为研究数学指令微调的重要工具。
实际应用
在实际应用中,OpenMathInstruct-1数据集可以被用于开发数学助手,辅助教育领域的教学与学习。它能够帮助构建能够处理复杂数学问题的智能系统,为在线教育平台、智能家教等提供技术支持。
衍生相关工作
基于OpenMathInstruct-1数据集,研究者们已经开发出一系列OpenMath模型,这些模型在数学问题解答方面展现出优异的性能。这些相关工作不仅推动了数学教育领域的智能化进程,也为机器学习领域提供了新的研究方向和启示。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作