malhajar/gsm8k-tr
收藏Hugging Face2024-03-05 更新2024-04-19 收录
下载链接:
https://hf-mirror.com/datasets/malhajar/gsm8k-tr
下载链接
链接失效反馈官方服务:
资源简介:
GSM8K-tr是GSM8K数据集的土耳其语翻译版本,专门用于土耳其语言模型的开发和评估。该数据集包含8.5K个高质量、语言多样的小学数学文字问题,支持多步推理的问答任务。每个问题需要2到8步来解决,主要涉及基本算术运算(+ − ×÷)。数据集分为两个配置:main和socratic,每个配置包含训练集和测试集。数据集的创建过程包括初始数据收集、标准化和多次验证,确保数据质量。数据集的使用场景包括测试土耳其语言模型的逻辑和数学能力,并已在多个基准测试中使用。
提供机构:
malhajar
原始信息汇总
数据集概述
- 名称: malhajar/GSM8K-tr
- 目的: 该数据集旨在为土耳其语言的大型语言模型(LLM)开发建立严格的基准,以评估土耳其语环境下LLM的性能。
- 特点: 是GSM8K数据集的翻译版本,专门设计用于OpenLLMTurkishLeaderboard。



