openai/gsm8k
收藏数据集概述
基本信息
- 数据集名称: Grade School Math 8K (GSM8K)
- 语言: 英语
- 许可证: MIT
- 多语言性: 单语种
- 大小类别: 1K<n<10K
- 源数据集: 原始数据
- 任务类别: 文本生成
- 标签: 数学应用题
数据集配置
主配置 (main)
- 特征:
question: 问题字符串answer: 答案字符串
- 分割:
train: 7473个样本, 3963202字节test: 1319个样本, 713732字节
- 下载大小: 2725633字节
- 数据集大小: 4676934字节
苏格拉底配置 (socratic)
- 特征:
question: 问题字符串answer: 答案字符串
- 分割:
train: 7473个样本, 5198108字节test: 1319个样本, 936859字节
- 下载大小: 3164254字节
- 数据集大小: 6134967字节
数据集描述
数据集摘要
GSM8K是一个包含8.5K高质量、语言多样化的初中数学应用题数据集。该数据集旨在支持需要多步推理的基本数学问题的问答任务。
- 这些问题需要2到8步来解决。
- 解决方案主要涉及使用基本算术运算(+ − ×÷)进行一系列基本计算以达到最终答案。
- 一个聪明的初中生应该能够解决每个问题:从论文中,“问题不需要超出早期代数水平的概念,绝大多数问题可以在不明确定义变量的情况下解决。”
- 解决方案以自然语言形式提供,而不是纯数学表达式。从论文中:“我们相信这是最有用的数据格式,我们期望它能揭示大型语言模型内部独白的特性”
支持的任务和排行榜
该数据集通常用于测试语言模型中的逻辑和数学能力。它已被用于许多基准测试,包括LLM Leaderboard。
数据实例
主配置 (main)
python { question: Natalia sold clips to 48 of her friends in April, and then she sold half as many clips in May. How many clips did Natalia sell altogether in April and May?, answer: Natalia sold 48/2 = <<48/2=24>>24 clips in May. Natalia sold 48+24 = <<48+24=72>>72 clips altogether in April and May.
72,
}
苏格拉底配置 (socratic)
python { question: Natalia sold clips to 48 of her friends in April, and then she sold half as many clips in May. How many clips did Natalia sell altogether in April and May?, answer: How many clips did Natalia sell in May? ** Natalia sold 48/2 = <<48/2=24>>24 clips in May. How many clips did Natalia sell altogether in April and May? ** Natalia sold 48+24 = <<48+24=72>>72 clips altogether in April and May.
72,
}
数据字段
question: 初中数学问题字符串answer: 包含多步推理、计算器注释和最终数值解决方案的完整答案字符串
数据分割
| 名称 | 训练集 | 测试集 |
|---|---|---|
| main | 7473 | 1319 |
| socratic | 7473 | 1319 |




