five

malhajar/gsm8k-tr

收藏
Hugging Face2024-03-05 更新2024-04-19 收录
下载链接:
https://hf-mirror.com/datasets/malhajar/gsm8k-tr
下载链接
链接失效反馈
官方服务:
资源简介:
GSM8K-tr是GSM8K数据集的土耳其语翻译版本,专门用于土耳其语言模型的开发和评估。该数据集包含8.5K个高质量、语言多样的小学数学文字问题,支持多步推理的问答任务。每个问题需要2到8步来解决,主要涉及基本算术运算(+ − ×÷)。数据集分为两个配置:main和socratic,每个配置包含训练集和测试集。数据集的创建过程包括初始数据收集、标准化和多次验证,确保数据质量。数据集的使用场景包括测试土耳其语言模型的逻辑和数学能力,并已在多个基准测试中使用。
提供机构:
malhajar
原始信息汇总

数据集概述

  • 名称: malhajar/GSM8K-tr
  • 目的: 该数据集旨在为土耳其语言的大型语言模型(LLM)开发建立严格的基准,以评估土耳其语环境下LLM的性能。
  • 特点: 是GSM8K数据集的翻译版本,专门设计用于OpenLLMTurkishLeaderboard。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作