Thomas-X-Yang/gsm8k-prolog
收藏数据集卡片 for GSM8K-Prolog
数据集描述
数据集概述
这是 GSM8K 数学推理数据集 的 Prolog 注释版本。我们使用了与 GSM8K 相同的分区和问题,并提示 GPT-4 生成解决这些问题的 Prolog 程序。然后我们手动修正了一些功能异常的样本。
支持的任务和排行榜
该数据集可用于训练语言模型以生成 Prolog 代码来解决数学问题并评估性能。
语言
数据集中的指令和输入为英文,输出为 Prolog。
数据集结构
数据实例
每个实例包含一个用于指导模型的字符串、一个用于小学级别数学问题的字符串和一个用于解决该问题的 Prolog 程序的字符串。
python { "instruction": "Please generate a piece of Prolog code to solve the given math problem.", "input": "Natalia sold clips to 48 of her friends in April, and then she sold half as many clips in May. How many clips did Natalia sell altogether in April and May?", "output": ":- use_module(library(clpq)).
sell_clips(natalia, april, 48).
solve(Total_amount) :- sell_clips(natalia, april, April_amount), {May_amount = April_amount / 2}, {Total_amount = May_amount + April_amount}." }
数据字段
GSM8K-Prolog 数据集遵循 Stanford Alpaca 中使用的指令提示。数据字段在 train 和 test 分组中相同。
- instruction: 模型应执行的任务。此数据集中的所有指令都是相同的,因为唯一的任务是使用 Prolog 解决数学问题。
- input: 小学数学问题的问题。
- output: 解决数学问题的 Prolog 程序。
数据分组
| name | train | validation |
|---|---|---|
| main | 7473 | 1319 |
附加信息
许可信息
GSM8K-Prolog 数据集在 MIT 许可证 下授权。
引用信息
[需要更多信息]




