HiTZ/MGSM-eu
收藏Hugging Face2025-02-24 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/HiTZ/MGSM-eu
下载链接
链接失效反馈官方服务:
资源简介:
MGSM-eu数据集是一个基于GSM8K数据集的子集,包含了250个小学数学问题,并且这些问题已经被专业翻译成巴斯克语(Basque)。数据集的结构包括训练集和测试集,分别包含8个和250个样本。每个样本包含问题、答案、答案数字和方程解等字段。数据集的创建是由HiTZ (UPV/EHU) 在ILENIA项目下进行的专业翻译工作。
MGSM-eu数据集是一个基于GSM8K数据集的子集,包含了250个小学数学问题,并且这些问题已经被专业翻译成巴斯克语(Basque)。数据集的结构包括训练集和测试集,分别包含8个和250个样本。每个样本包含问题、答案、答案数字和方程解等字段。数据集的创建是由HiTZ (UPV/EHU) 在ILENIA项目下进行的专业翻译工作。
提供机构:
HiTZ
原始信息汇总
数据集概述
数据集名称
- 名称: MGSM-eu
语言信息
- 语言: Basque (eu-ES)
许可信息
- 许可: CC-BY-SA-4.0
多语言性
- 多语言性: 单语种
数据集大小
- 大小: 小于1K (n<1K)
数据集来源
- 来源: 扩展自mgsm
任务类别
- 任务: 文本到文本生成
数据集结构
-
数据实例:
- 训练实例: 包含问题、答案、答案数字和方程式解决方案。
- 测试实例: 包含问题、答案(空)、答案数字和方程式解决方案(空)。
-
数据字段:
question(字符串): 小学数学问题的提问。answer(字符串): 问题的完整解答,包含多步骤推理和最终数字解答。answer_number(整数): 问题的数字解答。equation_solution(字符串): 问题的方程式解答。
-
数据分割:
- 训练: 8个实例
- 测试: 250个实例
数据集创建
- 创建方式: 专业翻译自英语MGSM数据集至巴斯克语,由HiTZ (UPV/EHU)在ILENIA项目框架内委托完成。
搜集汇总
数据集介绍

背景与挑战
背景概述
HiTZ/MGSM-eu是一个巴斯克语的小学数学问题数据集,基于GSM8K数据集的子集翻译而成。该数据集包含258个样本,其中8个用于训练、250个用于测试,每个样本提供问题、分步解答和数值答案,旨在支持语言模型在巴斯克语数学推理任务上的评估。
以上内容由遇见数据集搜集并总结生成



