five

HiTZ/MGSM-eu

收藏
Hugging Face2025-02-24 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/HiTZ/MGSM-eu
下载链接
链接失效反馈
官方服务:
资源简介:
MGSM-eu数据集是一个基于GSM8K数据集的子集,包含了250个小学数学问题,并且这些问题已经被专业翻译成巴斯克语(Basque)。数据集的结构包括训练集和测试集,分别包含8个和250个样本。每个样本包含问题、答案、答案数字和方程解等字段。数据集的创建是由HiTZ (UPV/EHU) 在ILENIA项目下进行的专业翻译工作。

MGSM-eu数据集是一个基于GSM8K数据集的子集,包含了250个小学数学问题,并且这些问题已经被专业翻译成巴斯克语(Basque)。数据集的结构包括训练集和测试集,分别包含8个和250个样本。每个样本包含问题、答案、答案数字和方程解等字段。数据集的创建是由HiTZ (UPV/EHU) 在ILENIA项目下进行的专业翻译工作。
提供机构:
HiTZ
原始信息汇总

数据集概述

数据集名称

  • 名称: MGSM-eu

语言信息

  • 语言: Basque (eu-ES)

许可信息

  • 许可: CC-BY-SA-4.0

多语言性

  • 多语言性: 单语种

数据集大小

  • 大小: 小于1K (n<1K)

数据集来源

  • 来源: 扩展自mgsm

任务类别

  • 任务: 文本到文本生成

数据集结构

  • 数据实例:

    • 训练实例: 包含问题、答案、答案数字和方程式解决方案。
    • 测试实例: 包含问题、答案(空)、答案数字和方程式解决方案(空)。
  • 数据字段:

    • question (字符串): 小学数学问题的提问。
    • answer (字符串): 问题的完整解答,包含多步骤推理和最终数字解答。
    • answer_number (整数): 问题的数字解答。
    • equation_solution (字符串): 问题的方程式解答。
  • 数据分割:

    • 训练: 8个实例
    • 测试: 250个实例

数据集创建

  • 创建方式: 专业翻译自英语MGSM数据集至巴斯克语,由HiTZ (UPV/EHU)在ILENIA项目框架内委托完成。
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
HiTZ/MGSM-eu是一个巴斯克语的小学数学问题数据集,基于GSM8K数据集的子集翻译而成。该数据集包含258个样本,其中8个用于训练、250个用于测试,每个样本提供问题、分步解答和数值答案,旨在支持语言模型在巴斯克语数学推理任务上的评估。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作