projecte-aina/mgsm_ca
收藏Hugging Face2024-06-17 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/projecte-aina/mgsm_ca
下载链接
链接失效反馈官方服务:
资源简介:
mgsm_ca(多语言小学数学 - 加泰罗尼亚语)是一个用于评估多步数学推理能力的数据集,包含小学数学应用题。数据集包括8个训练实例和250个测试实例。每个实例包含一个数学问题、逐步解答、最终结果以及用方程表示的解决方案。数据集由BSC-CNS的语言技术部门策划,并由Projecte AINA资助。
mgsm_ca(多语言小学数学 - 加泰罗尼亚语)是一个用于评估多步数学推理能力的数据集,包含小学数学应用题。数据集包括8个训练实例和250个测试实例。每个实例包含一个数学问题、逐步解答、最终结果以及用方程表示的解决方案。数据集由BSC-CNS的语言技术部门策划,并由Projecte AINA资助。
提供机构:
projecte-aina
原始信息汇总
数据集概述
基本信息
- 语言: 加泰罗尼亚语
- 许可证: MIT
- 数据集大小:
- 下载大小: 99029 bytes
- 数据集大小: 146588 bytes
- 任务类别: 问答
- 数据集名称: mgsm_ca
数据集结构
- 特征:
question: 字符串类型,数学问题answer: 字符串类型,逐步解答answer_number: 字符串类型,最终结果equation_solution: 字符串类型,方程式解答
- 分割:
test: 250个实例,143652 bytestrain: 8个实例,2936 bytes
数据集详情
- 设计目的: 评估多步骤数学推理能力,使用小学数学应用题
- 实例数量:
- 训练集: 8个实例
- 测试集: 250个实例
- 数据来源: 从英语数据集MGSM专业翻译而来
数据集使用
- 直接用途:
- 常识问答
- 阅读理解评估
- 逻辑推理评估
- 不当用途:
- 不应使用测试集训练语言模型
数据集创建
- 翻译指南:
- 日期与单位转换
- 人名翻译
- 语言风格
- 数据集逻辑
- 错误处理
- 避免模式与保持长度
- 数据生产者: 单个加泰罗尼亚语母语翻译者
数据集联系
- 联系人: Language Technologies Unit (langtech@bsc.es) at the Barcelona Supercomputing Center (BSC)



