malhajar/gsm8k_tr-v0.2
收藏Hugging Face2024-05-02 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/malhajar/gsm8k_tr-v0.2
下载链接
链接失效反馈官方服务:
资源简介:
`gsm8k-tr-v0.2`(Grade School Math 8K Version 0.2)是一个包含8.5K个高质量、语言多样的小学数学问题的数据集,专门为土耳其语言设计。该数据集最初是为了支持在需要多步推理的基本数学问题上的问答任务而创建的,随后通过GPT-4生成并经过严格的人工校正,以确保准确性和可靠性。解决方案涉及使用基本算术运算(+、−、×、÷)进行一系列基本计算以得出最终答案。该数据集支持评估土耳其语言模型的推理能力。
`gsm8k-tr-v0.2`(Grade School Math 8K Version 0.2)是一个包含8.5K个高质量、语言多样的小学数学问题的数据集,专门为土耳其语言设计。该数据集最初是为了支持在需要多步推理的基本数学问题上的问答任务而创建的,随后通过GPT-4生成并经过严格的人工校正,以确保准确性和可靠性。解决方案涉及使用基本算术运算(+、−、×、÷)进行一系列基本计算以得出最终答案。该数据集支持评估土耳其语言模型的推理能力。
提供机构:
malhajar
原始信息汇总
数据集概述
数据集名称
gsm8k-tr-v0.2
数据集描述
gsm8k-tr-v0.2 是一个专为土耳其语言设计的数学问题解答数据集,包含8.5K个高质量、语言多样性的基础数学问题。该数据集通过GPT-4生成,并由人类专家进行详细校对,确保答案和推理的正确性。
数据集特征
- 问题(question): 类型为字符串,包含土耳其语的数学问题。
- 答案(answer): 类型为字符串,包含详细的解答步骤和最终的数值答案。
数据集结构
- 测试集(test): 包含1317个实例,总大小为863688字节。
数据集用途
该数据集用于评估语言模型在土耳其语中的逻辑和数学推理能力,并用于如OpenLLMTurkishLeaderboard_v0.2等基准测试。
语言
数据集中的文本语言为土耳其语。
示例
python { question: James haftada iki kez 2 farklı arkadaşına 3 sayfalık mektup yazıyor. Yılda kaç sayfa yazıyor?, answer: Her arkadaşına haftada 32=6 sayfa yazıyor. Yani her hafta 12 sayfa yazıyor. Bu onun yılda 1252=624 sayfa yazdığı anlamına gelir. Toplam: 624 sayfa, }



