five

meta-math/GSM8K_zh|数学推理数据集|中文数学问答数据集

收藏
hugging_face2023-12-04 更新2024-03-04 收录
数学推理
中文数学问答
下载链接:
https://hf-mirror.com/datasets/meta-math/GSM8K_zh
下载链接
链接失效反馈
资源简介:
GSM8K_zh是一个专门为数学推理设计的中文数据集,包含了从英文数据集GSM8K翻译过来的问题和答案。该数据集由7473个训练样本和1319个测试样本组成,分别用于监督微调和模型评估。训练样本包含完整的问题和答案,而测试样本仅提供翻译后的问题。此数据集适用于中文和英文的问题回答任务,特别是数学问题回答。

GSM8K_zh是一个专门为数学推理设计的中文数据集,包含了从英文数据集GSM8K翻译过来的问题和答案。该数据集由7473个训练样本和1319个测试样本组成,分别用于监督微调和模型评估。训练样本包含完整的问题和答案,而测试样本仅提供翻译后的问题。此数据集适用于中文和英文的问题回答任务,特别是数学问题回答。
提供机构:
meta-math
原始信息汇总

数据集概述

基本信息

  • 许可证:MIT
  • 任务类别:问答
  • 语言:英语、中文
  • 标签:数学、数学问答、中文数学问答
  • 规模:n<1K

数据集描述

  • 名称:GSM8K_zh
  • 描述:GSM8K_zh是一个用于中文数学推理的数据集,问题-答案对由GSM8K数据集(https://github.com/openai/grade-school-math/tree/master)通过GPT-3.5-Turbo进行少量提示翻译得到。
  • 样本数量:包含7473个训练样本和1319个测试样本。训练样本用于监督微调,测试样本用于评估
  • 样本结构
    • 训练样本:包含question_zh(问题)和answer_zh(答案)键。
    • 测试样本:仅提供翻译后的问题(question_zh)。

引用

  • 文献: bibtex @article{yu2023metamath, title={MetaMath: Bootstrap Your Own Mathematical Questions for Large Language Models}, author={Yu, Longhui and Jiang, Weisen and Shi, Han and Yu, Jincheng and Liu, Zhengying and Zhang, Yu and Kwok, James T and Li, Zhenguo and Weller, Adrian and Liu, Weiyang}, journal={arXiv preprint arXiv:2309.12284}, year={2023} }
AI搜集汇总
数据集介绍
main_image_url
构建方式
GSM8K_zh数据集是通过将GSM8K数据集中的问题和答案对翻译成中文构建而成。具体而言,该数据集利用GPT-3.5-Turbo模型进行少样本提示翻译,确保了翻译的准确性和自然性。数据集包含7473个训练样本和1319个测试样本,分别用于监督微调和模型评估。训练样本中包含问题和答案的对应关系,而测试样本仅提供翻译后的问题,以便进行独立评估。
特点
GSM8K_zh数据集的主要特点在于其专注于中文环境下的数学推理任务,填补了中文数学问答数据集的空白。数据集的翻译过程采用了先进的GPT-3.5-Turbo模型,确保了翻译质量的高标准。此外,数据集的结构设计合理,训练和测试样本的划分清晰,便于模型在不同阶段进行有效的学习和评估。
使用方法
GSM8K_zh数据集适用于需要在中文环境下进行数学推理任务的模型训练和评估。用户可以利用训练样本进行监督微调,以提升模型在中文数学问题上的表现。测试样本则可用于评估模型的实际推理能力,确保模型在真实场景中的应用效果。数据集的结构清晰,使用便捷,适合各类研究者和开发者进行相关实验和应用开发。
背景与挑战
背景概述
数学推理在人工智能领域中占据着举足轻重的地位,尤其是在自然语言处理和教育科技的交叉领域。`GSM8K_zh`数据集应运而生,旨在为中文环境下的数学问题解答提供高质量的训练和测试资源。该数据集由`GPT-3.5-Turbo`通过少样本提示技术从英文原版GSM8K数据集翻译而来,涵盖了7473个训练样本和1319个测试样本。主要研究人员包括Yu Longhui等人,他们的研究成果发表于2023年的预印本,题为《MetaMath: Bootstrap Your Own Mathematical Questions for Large Language Models》。该数据集的推出,不仅丰富了中文数学推理的数据资源,也为大语言模型在中文数学教育中的应用提供了新的可能性。
当前挑战
尽管`GSM8K_zh`数据集在中文数学推理领域具有重要意义,但其构建过程中仍面临诸多挑战。首先,翻译质量直接影响数据集的有效性,如何确保翻译的准确性和自然性是一个关键问题。其次,少样本提示技术虽然提高了翻译效率,但也可能引入不确定性,影响模型的训练效果。此外,数据集的规模相对较小,如何在有限的样本中提取出有效的训练特征,也是一个亟待解决的问题。最后,该数据集的应用场景主要集中在教育领域,如何确保其在实际教学中的有效性和适用性,仍需进一步的研究和验证。
常用场景
经典使用场景
GSM8K_zh数据集在数学推理领域中具有经典的使用场景,主要用于中文环境下的数学问答任务。该数据集通过GPT-3.5-Turbo模型将原始的GSM8K数据集翻译为中文,提供了丰富的训练和测试样本,特别适用于监督微调(supervised fine-tuning)和模型评估。
实际应用
在实际应用中,GSM8K_zh数据集可广泛应用于教育技术、智能辅导系统及自动化考试评估等领域。通过提供准确的中文数学问答解决方案,该数据集能够帮助开发更智能、更高效的教育工具,提升学生的学习体验和教师的教学效率。
衍生相关工作
GSM8K_zh数据集的发布激发了大量相关研究工作,特别是在中文数学推理和跨语言问答系统领域。研究者们基于此数据集开发了多种模型和算法,进一步推动了中文数学问答技术的发展,同时也为跨语言知识迁移和模型泛化能力研究提供了宝贵的资源。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

LFW

人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download

AI_Studio 收录

中国知识产权局专利数据库

该数据集包含了中国知识产权局发布的专利信息,涵盖了专利的申请、授权、转让等详细记录。数据内容包括专利号、申请人、发明人、申请日期、授权日期、专利摘要等。

www.cnipa.gov.cn 收录

OpenSonarDatasets

OpenSonarDatasets是一个致力于整合开放源代码声纳数据集的仓库,旨在为水下研究和开发提供便利。该仓库鼓励研究人员扩展当前的数据集集合,以增加开放源代码声纳数据集的可见性,并提供一个更容易查找和比较数据集的方式。

github 收录

THUCNews

THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。本次比赛数据集在原始新浪新闻分类体系的基础上,重新整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。提供训练数据共832471条。

github 收录

Breast Cancer Dataset

该项目专注于清理和转换一个乳腺癌数据集,该数据集最初由卢布尔雅那大学医学中心肿瘤研究所获得。目标是通过应用各种数据转换技术(如分类、编码和二值化)来创建一个可以由数据科学团队用于未来分析的精炼数据集。

github 收录