gsm8k_fr_50_250406

Hugging Face2025-04-08 更新2025-04-09 收录

下载链接：

https://huggingface.co/datasets/cmh/gsm8k_fr_50_250406

下载链接

链接失效反馈

官方服务：

资源简介：

这是一个由50行GSM8K数据集翻译成法语的数据集，使用quickmt/quickmt-en-fr进行翻译。为了适应模型处理，问题部分被限制在256个tokens以内，而回答部分被限制在768个tokens以内，使用的tokenizer是Phi-4。

创建时间：

2025-04-06

搜集汇总

数据集介绍

构建方式

在数学推理领域，跨语言数据资源的构建对促进算法公平性具有重要意义。gsm8k_fr_50_250406数据集源自经典英文数学题集GSM8K，通过quickmt/quickmt-en-fr机器翻译系统转化为法语版本，并采用Phi-4分词器进行长度优化。为确保模型输入输出的规范性，原始问题被裁剪至256个token以内，相应解答则控制在768个token的合理范围内，最终形成包含50条样本的精炼数据集。

特点

该数据集凸显出鲜明的跨语言特性与工程考量。作为GSM8K的法语子集，其问题涵盖基础算术到多步推理的数学题型，经机器翻译后保留了原数据集的逻辑结构。特别值得注意的是，通过严格的token长度限制，该数据集适配现代语言模型的上下文窗口，同时维持了数学语义的完整性，为研究者提供了考察模型跨语言数学推理能力的标准化测试基准。

使用方法

针对法语数学推理任务的设计特点，该数据集推荐用于评估模型的跨语言迁移能力。研究者可直接将法语问题输入模型，通过对比生成答案与标注解答的匹配度来量化性能。由于问题与答案经过长度标准化，该数据集尤其适合作为轻量级测试集，用于快速验证模型在法语数学任务上的零样本表现或微调效果，亦可用于分析机器翻译对数学语义保留的影响。

背景与挑战

背景概述

gsm8k_fr_50_250406数据集源于数学推理领域著名的GSM8K基准测试集，由OpenAI研究团队于2021年创建，旨在评估模型解决小学数学应用题的能力。该法语子集通过机器翻译技术对原始英语问题进行本地化处理，并针对Phi-4模型的上下文窗口进行优化裁剪，体现了跨语言知识迁移在数学推理任务中的实践探索。作为多语言数学推理研究的重要资源，其为法语区教育科技发展及语言大模型能力评估提供了新的实验基础。

当前挑战

该数据集面临双重技术挑战：在领域问题层面，数学应用题求解需要模型同时掌握法语语义理解与多步算术推理能力，而机器翻译可能引入的语义偏差会加剧求解难度；在构建过程中，既要维持原始问题的数学逻辑完整性，又需满足Phi-4模型严格的token长度限制，这对问题重构算法提出了精确控制的要求。此外，小规模样本对模型泛化能力的评估效度也构成显著制约。

常用场景

经典使用场景

在自然语言处理领域，跨语言数学推理能力的评估日益受到关注。gsm8k_fr_50_250406数据集作为GSM8K的法语子集，为研究者提供了评估法语语言模型数学解题能力的标准基准。其精心设计的题目长度限制（问题<256词元，解答<768词元）特别适配Phi-4等现代分词器的处理窗口，成为测试模型跨语言迁移性能的理想工具。

衍生相关工作

基于该数据集的特性，已有研究探索多语言数学推理的迁移学习范式。典型工作包括开发法语-英语双语联合训练框架，以及构建跨语言数学术语的嵌入表示。部分团队将其与原始GSM8K结合，研究语言模型在混合语言环境中的算术推理能力退化现象。

数据集最近研究