five

projecte-aina/mgsm_ca

收藏
Hugging Face2024-06-17 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/projecte-aina/mgsm_ca
下载链接
链接失效反馈
官方服务:
资源简介:
mgsm_ca(多语言小学数学 - 加泰罗尼亚语)是一个用于评估多步数学推理能力的数据集,包含小学数学应用题。数据集包括8个训练实例和250个测试实例。每个实例包含一个数学问题、逐步解答、最终结果以及用方程表示的解决方案。数据集由BSC-CNS的语言技术部门策划,并由Projecte AINA资助。

mgsm_ca(多语言小学数学 - 加泰罗尼亚语)是一个用于评估多步数学推理能力的数据集,包含小学数学应用题。数据集包括8个训练实例和250个测试实例。每个实例包含一个数学问题、逐步解答、最终结果以及用方程表示的解决方案。数据集由BSC-CNS的语言技术部门策划,并由Projecte AINA资助。
提供机构:
projecte-aina
原始信息汇总

数据集概述

基本信息

  • 语言: 加泰罗尼亚语
  • 许可证: MIT
  • 数据集大小:
    • 下载大小: 99029 bytes
    • 数据集大小: 146588 bytes
  • 任务类别: 问答
  • 数据集名称: mgsm_ca

数据集结构

  • 特征:
    • question: 字符串类型,数学问题
    • answer: 字符串类型,逐步解答
    • answer_number: 字符串类型,最终结果
    • equation_solution: 字符串类型,方程式解答
  • 分割:
    • test: 250个实例,143652 bytes
    • train: 8个实例,2936 bytes

数据集详情

  • 设计目的: 评估多步骤数学推理能力,使用小学数学应用题
  • 实例数量:
    • 训练集: 8个实例
    • 测试集: 250个实例
  • 数据来源: 从英语数据集MGSM专业翻译而来

数据集使用

  • 直接用途:
    • 常识问答
    • 阅读理解评估
    • 逻辑推理评估
  • 不当用途:
    • 不应使用测试集训练语言模型

数据集创建

  • 翻译指南:
    • 日期与单位转换
    • 人名翻译
    • 语言风格
    • 数据集逻辑
    • 错误处理
    • 避免模式与保持长度
  • 数据生产者: 单个加泰罗尼亚语母语翻译者

数据集联系

  • 联系人: Language Technologies Unit (langtech@bsc.es) at the Barcelona Supercomputing Center (BSC)
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作