meta-math/GSM8K_zh

Name: meta-math/GSM8K_zh
Creator: meta-math
Published: 2023-12-04 04:02:01
License: 暂无描述

Hugging Face2023-12-04 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/meta-math/GSM8K_zh

下载链接

链接失效反馈

官方服务：

资源简介：

GSM8K_zh是一个专门为数学推理设计的中文数据集，包含了从英文数据集GSM8K翻译过来的问题和答案。该数据集由7473个训练样本和1319个测试样本组成，分别用于监督微调和模型评估。训练样本包含完整的问题和答案，而测试样本仅提供翻译后的问题。此数据集适用于中文和英文的问题回答任务，特别是数学问题回答。

提供机构：

meta-math

原始信息汇总

数据集概述

基本信息

许可证：MIT
任务类别：问答
语言：英语、中文
标签：数学、数学问答、中文数学问答
规模：n<1K

数据集描述

名称：GSM8K_zh
描述：GSM8K_zh是一个用于中文数学推理的数据集，问题-答案对由GSM8K数据集（https://github.com/openai/grade-school-math/tree/master）通过GPT-3.5-Turbo进行少量提示翻译得到。
样本数量：包含7473个训练样本和1319个测试样本。训练样本用于监督微调，测试样本用于评估。
样本结构：
- 训练样本：包含question_zh（问题）和answer_zh（答案）键。
- 测试样本：仅提供翻译后的问题（question_zh）。

引用

文献： bibtex @article{yu2023metamath, title={MetaMath: Bootstrap Your Own Mathematical Questions for Large Language Models}, author={Yu, Longhui and Jiang, Weisen and Shi, Han and Yu, Jincheng and Liu, Zhengying and Zhang, Yu and Kwok, James T and Li, Zhenguo and Weller, Adrian and Liu, Weiyang}, journal={arXiv preprint arXiv:2309.12284}, year={2023} }

搜集汇总

数据集介绍

构建方式

GSM8K_zh数据集是通过将GSM8K数据集中的问题和答案对翻译成中文构建而成。具体而言，该数据集利用GPT-3.5-Turbo模型进行少样本提示翻译，确保了翻译的准确性和自然性。数据集包含7473个训练样本和1319个测试样本，分别用于监督微调和模型评估。训练样本中包含问题和答案的对应关系，而测试样本仅提供翻译后的问题，以便进行独立评估。

特点

GSM8K_zh数据集的主要特点在于其专注于中文环境下的数学推理任务，填补了中文数学问答数据集的空白。数据集的翻译过程采用了先进的GPT-3.5-Turbo模型，确保了翻译质量的高标准。此外，数据集的结构设计合理，训练和测试样本的划分清晰，便于模型在不同阶段进行有效的学习和评估。

使用方法

GSM8K_zh数据集适用于需要在中文环境下进行数学推理任务的模型训练和评估。用户可以利用训练样本进行监督微调，以提升模型在中文数学问题上的表现。测试样本则可用于评估模型的实际推理能力，确保模型在真实场景中的应用效果。数据集的结构清晰，使用便捷，适合各类研究者和开发者进行相关实验和应用开发。

背景与挑战

背景概述

数学推理在人工智能领域中占据着举足轻重的地位，尤其是在自然语言处理和教育科技的交叉领域。`GSM8K_zh`数据集应运而生，旨在为中文环境下的数学问题解答提供高质量的训练和测试资源。该数据集由`GPT-3.5-Turbo`通过少样本提示技术从英文原版GSM8K数据集翻译而来，涵盖了7473个训练样本和1319个测试样本。主要研究人员包括Yu Longhui等人，他们的研究成果发表于2023年的预印本，题为《MetaMath: Bootstrap Your Own Mathematical Questions for Large Language Models》。该数据集的推出，不仅丰富了中文数学推理的数据资源，也为大语言模型在中文数学教育中的应用提供了新的可能性。

当前挑战

尽管`GSM8K_zh`数据集在中文数学推理领域具有重要意义，但其构建过程中仍面临诸多挑战。首先，翻译质量直接影响数据集的有效性，如何确保翻译的准确性和自然性是一个关键问题。其次，少样本提示技术虽然提高了翻译效率，但也可能引入不确定性，影响模型的训练效果。此外，数据集的规模相对较小，如何在有限的样本中提取出有效的训练特征，也是一个亟待解决的问题。最后，该数据集的应用场景主要集中在教育领域，如何确保其在实际教学中的有效性和适用性，仍需进一步的研究和验证。

常用场景

经典使用场景

GSM8K_zh数据集在数学推理领域中具有经典的使用场景，主要用于中文环境下的数学问答任务。该数据集通过GPT-3.5-Turbo模型将原始的GSM8K数据集翻译为中文，提供了丰富的训练和测试样本，特别适用于监督微调（supervised fine-tuning）和模型评估。

实际应用

在实际应用中，GSM8K_zh数据集可广泛应用于教育技术、智能辅导系统及自动化考试评估等领域。通过提供准确的中文数学问答解决方案，该数据集能够帮助开发更智能、更高效的教育工具，提升学生的学习体验和教师的教学效率。

衍生相关工作

GSM8K_zh数据集的发布激发了大量相关研究工作，特别是在中文数学推理和跨语言问答系统领域。研究者们基于此数据集开发了多种模型和算法，进一步推动了中文数学问答技术的发展，同时也为跨语言知识迁移和模型泛化能力研究提供了宝贵的资源。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集