pgsm8k
收藏Hugging Face2026-02-05 更新2026-02-07 收录
下载链接:
https://huggingface.co/datasets/AmirFazlollahi/pgsm8k
下载链接
链接失效反馈官方服务:
资源简介:
Persian GSM8K 是一个波斯语(Farsi)数学推理数据集,包含7,473个训练样本和1,319个测试样本。数据集包含三个文本字段:question(问题)、answer(解答过程)和outright_answer(直接答案)。数据规模属于1K到10K样本的中小规模类别。该数据集是著名的GSM8K数学题数据集的波斯语版本,适用于数学问题解决、语言模型推理能力评估等自然语言处理任务。
Persian GSM8K is a Persian (Farsi) mathematical reasoning dataset containing 7,473 training samples and 1,319 test samples. It includes three text fields: question, answer (detailed solution process), and outright_answer (direct final answer). The dataset falls into the small-to-medium scale category with a sample size ranging from 1K to 10K. As the Persian version of the well-known GSM8K mathematical problem dataset, it is suitable for natural language processing tasks such as mathematical problem-solving and reasoning capability evaluation of language models.
创建时间:
2026-02-05
搜集汇总
数据集介绍

构建方式
在数学推理领域,波斯语GSM8K数据集的构建体现了对多语言教育资源扩展的深入考量。该数据集源自经典的GSM8K英语数学问题集,通过专业翻译与本地化流程,将原始的英语题目转化为波斯语版本。构建过程中,不仅注重语言转换的准确性,还确保了数学问题的逻辑结构与文化背景适应波斯语使用者的认知习惯。数据集包含训练集与测试集,分别收录了7473和1319个样本,每个样本均包含问题、答案及直接答案三个核心字段,为波斯语数学教育提供了结构化的资源支持。
特点
波斯语GSM8K数据集的特点在于其专注于基础数学问题的多语言呈现。数据集以波斯语为载体,涵盖了涉及基本算术与逻辑推理的多样化题目,旨在评估模型在波斯语语境下的数学解题能力。每个样本均提供问题文本、分步解答过程以及最终的直接答案,这种多层次的答案设计有助于深入分析模型的推理路径。数据规模适中,语言标签明确标注为波斯语,使其成为研究多语言数学推理任务中不可或缺的基准工具。
使用方法
使用波斯语GSM8K数据集时,研究者可将其应用于数学问题求解模型的训练与评估。数据集已划分为训练集和测试集,用户可直接加载相应配置进行模型微调或零样本测试。在自然语言处理任务中,该数据集支持对波斯语文本的理解与生成能力考察,尤其适用于评估模型在跨语言数学推理中的表现。通过分析模型对问题、分步答案及直接答案的生成质量,能够系统性地衡量其在波斯语数学教育应用中的潜力与局限性。
背景与挑战
背景概述
波斯语GSM8K数据集(pgsm8k)作为数学推理领域的重要资源,由研究团队于近年构建,旨在应对多语言自然语言处理中的数学问题求解挑战。该数据集专注于小学水平的数学应用题,通过提供波斯语的问题与解答,填补了非英语数学推理数据集的空白,促进了跨语言模型的公平评估与发展。其创建不仅推动了波斯语社区在人工智能领域的参与,也为全球研究者提供了检验模型逻辑推理与语言理解能力的标准化平台,对教育技术与机器智能的交叉研究产生了深远影响。
当前挑战
波斯语GSM8K数据集面临的挑战主要体现在两个方面:在领域问题层面,数学应用题求解要求模型具备复杂的多步推理与精确计算能力,同时需处理波斯语特有的语法结构与文化语境,这增加了模型泛化与准确性的难度;在构建过程中,挑战源于高质量双语数据的稀缺性,需要确保问题翻译的语义保真度与解答的逻辑一致性,并克服波斯语数字系统与数学表达的特殊性,这些因素共同制约了数据集的规模扩展与质量提升。
常用场景
经典使用场景
在自然语言处理领域,波斯语数学推理任务常因高质量数据稀缺而面临挑战。PGSM8K数据集作为波斯语版本的GSM8K,其经典使用场景集中于评估和训练大型语言模型在波斯语环境下的数学问题求解能力。该数据集通过提供多样化的数学应用题,支持模型进行端到端的推理训练,尤其适用于测试模型在跨语言迁移中的逻辑思维和计算准确性,为波斯语NLP研究提供了标准化的基准平台。
实际应用
在实际应用中,PGSM8K数据集可服务于波斯语地区的教育科技和智能助手开发。例如,基于该数据集训练的模型能够集成到在线辅导系统中,为学生提供自动化的数学解题支持;同时,它也可用于增强波斯语聊天机器人的逻辑对话能力,提升其在金融计算或日常规划等场景中的实用性,从而推动波斯语AI工具的本土化与普及。
衍生相关工作
围绕PGSM8K数据集,已衍生出多项经典研究工作,包括针对波斯语数学推理的微调策略探索和跨语言模型适配技术。这些工作通常借鉴原始GSM8K的英文处理方法,结合波斯语的语言特性,开发了专门的评估框架和增强模型。相关成果不仅丰富了波斯语NLP的文献体系,还为其他低资源语言的数学数据集构建提供了可复用的方法论参考。
以上内容由遇见数据集搜集并总结生成



