meta-math/MetaMathQA_GSM8K_zh

Name: meta-math/MetaMathQA_GSM8K_zh
Creator: meta-math
Published: 2023-12-04 05:23:20
License: 暂无描述

Hugging Face2023-12-04 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/meta-math/MetaMathQA_GSM8K_zh

下载链接

链接失效反馈

官方服务：

资源简介：

`MetaMathQA_GSM8K_zh`是一个用于中文数学推理的数据集，包含231685个样本。这些样本是通过`GPT-3.5-Turbo`从MetaMathQA翻译而来的，采用了少量示例提示的方法。

提供机构：

meta-math

原始信息汇总

数据集概述

数据集名称

MetaMathQA_GSM8K_zh

数据集描述

MetaMathQA_GSM8K_zh 是一个用于中文数学推理的数据集，问题-答案对由 GPT-3.5-Turbo 通过少样本提示从 MetaMathQA 翻译而来。该数据集包含 231685 个样本。

任务类别

问答

语言

英语
中文

大小类别

样本数小于1千

引用

如果 GSM8K_zh 数据集对你的项目/论文有用，请引用以下论文：

bibtex @article{yu2023metamath, title={MetaMath: Bootstrap Your Own Mathematical Questions for Large Language Models}, author={Yu, Longhui and Jiang, Weisen and Shi, Han and Yu, Jincheng and Liu, Zhengying and Zhang, Yu and Kwok, James T and Li, Zhenguo and Weller, Adrian and Liu, Weiyang}, journal={arXiv preprint arXiv:2309.12284}, year={2023} }

搜集汇总

数据集介绍

构建方式

在数学推理领域，高质量中文数据集的稀缺性促使研究者探索跨语言迁移的有效途径。MetaMathQA_GSM8K_zh数据集通过精心设计的翻译流程构建而成，其基础源自英文原版MetaMathQA。利用GPT-3.5-Turbo模型在少量示例提示的引导下，系统地将原始数学问题与答案对转化为中文表达，最终形成包含231,685个样本的语料库。这一过程不仅实现了语言层面的转换，更确保了数学逻辑与问题结构的完整性，为中文数学推理研究提供了重要资源。

使用方法

研究人员可将该数据集直接应用于数学推理模型的训练与评估流程。典型使用场景包括：作为监督学习数据输入大型语言模型，以提升其中文数学问题求解能力；作为基准测试集，用于衡量模型在翻译后数学问题上的表现；或作为增强数据与原始英文数据集结合，探究多语言数学推理的迁移效应。使用前建议进行数据分布分析，并根据具体任务需求划分训练验证集，引用时需注明原始MetaMath论文以遵循学术规范。

背景与挑战

背景概述

在人工智能领域，数学推理能力是衡量大型语言模型智能水平的关键指标之一。MetaMathQA_GSM8K_zh数据集由MetaMath团队于2023年创建，其核心研究问题聚焦于通过高质量的中文数学问题-答案对，提升语言模型在复杂数学逻辑推理方面的性能。该数据集基于MetaMathQA的英文原版，利用GPT-3.5-Turbo模型进行少样本提示翻译，涵盖了231,685个样本，旨在为中文数学推理任务提供标准化评估基准，推动自然语言处理与数学交叉领域的研究进展。

当前挑战

该数据集致力于解决数学问题自动解答中的核心挑战，包括模型对多步骤逻辑推理的准确建模、以及跨语言环境下数学语义的精确迁移。在构建过程中，面临的主要困难在于确保翻译后中文问题的数学逻辑完整性，避免因语言转换引入歧义或信息损失；同时，需维持原数据集的问题多样性与难度分布，以支持模型在真实场景下的泛化能力评估。

常用场景

经典使用场景

在数学推理领域，MetaMathQA_GSM8K_zh数据集为研究者提供了丰富的汉语数学问题-答案对，其经典使用场景集中于训练和评估大型语言模型在中文环境下的数学问题解决能力。通过将英文原数据集MetaMathQA翻译为中文，该数据集支持模型学习跨语言数学逻辑表达，常用于微调或基准测试，以提升模型在复杂算术和代数推理任务中的表现。

解决学术问题

该数据集有效应对了数学推理研究中语言多样性不足的挑战，解决了非英语数学数据集稀缺的学术问题。它促进了跨语言数学建模的发展，使研究者能够探索语言对数学思维表达的影响，并为多语言大型语言模型的数学能力评估提供了标准化工具，推动了数学教育技术与自然语言处理领域的交叉创新。

实际应用

在实际应用中，MetaMathQA_GSM8K_zh数据集可集成于智能教育系统，辅助开发汉语数学辅导工具或自动化解题平台。它支持构建能够理解并解答中文数学问题的AI助手，应用于在线学习、作业批改等场景，提升数学教育的个性化和可及性，尤其惠及汉语使用者的学习体验。

数据集最近研究