five

Thomas-X-Yang/gsm8k-prolog

收藏
Hugging Face2024-04-01 更新2024-06-15 收录
下载链接:
https://hf-mirror.com/datasets/Thomas-X-Yang/gsm8k-prolog
下载链接
链接失效反馈
官方服务:
资源简介:
GSM8K-Prolog数据集是GSM8K数学推理数据集的Prolog注释版本。该数据集使用GPT-4生成Prolog程序来解决数学问题,并手动修正了一些错误样本。数据集支持的任务是训练语言模型生成Prolog代码以解决数学问题。数据集的语言为英语,输出为Prolog。数据集结构包括每个实例的指令、数学问题和Prolog程序。数据集分为训练集和验证集,分别包含7473和1319个样本。数据集采用MIT许可证。

The GSM8K-Prolog dataset is a Prolog-annotated version of the GSM8K mathematical reasoning dataset. This dataset uses GPT-4 to generate Prolog programs for solving mathematical problems, with some erroneous samples manually corrected. The task supported by this dataset is to train language models to generate Prolog code to solve mathematical problems. The dataset is in English, with outputs formatted as Prolog code. The dataset structure includes the instruction, mathematical problem, and Prolog program for each instance. The dataset is split into training and validation sets, which contain 7,473 and 1,319 samples respectively. The dataset is released under the MIT License.
提供机构:
Thomas-X-Yang
原始信息汇总

数据集卡片 for GSM8K-Prolog

数据集描述

数据集概述

这是 GSM8K 数学推理数据集 的 Prolog 注释版本。我们使用了与 GSM8K 相同的分区和问题,并提示 GPT-4 生成解决这些问题的 Prolog 程序。然后我们手动修正了一些功能异常的样本。

支持的任务和排行榜

该数据集可用于训练语言模型以生成 Prolog 代码来解决数学问题并评估性能。

语言

数据集中的指令和输入为英文,输出为 Prolog。

数据集结构

数据实例

每个实例包含一个用于指导模型的字符串、一个用于小学级别数学问题的字符串和一个用于解决该问题的 Prolog 程序的字符串。

python { "instruction": "Please generate a piece of Prolog code to solve the given math problem.", "input": "Natalia sold clips to 48 of her friends in April, and then she sold half as many clips in May. How many clips did Natalia sell altogether in April and May?", "output": ":- use_module(library(clpq)).

sell_clips(natalia, april, 48).

solve(Total_amount) :- sell_clips(natalia, april, April_amount), {May_amount = April_amount / 2}, {Total_amount = May_amount + April_amount}." }

数据字段

GSM8K-Prolog 数据集遵循 Stanford Alpaca 中使用的指令提示。数据字段在 traintest 分组中相同。

  • instruction: 模型应执行的任务。此数据集中的所有指令都是相同的,因为唯一的任务是使用 Prolog 解决数学问题。
  • input: 小学数学问题的问题。
  • output: 解决数学问题的 Prolog 程序。

数据分组

name train validation
main 7473 1319

附加信息

许可信息

GSM8K-Prolog 数据集在 MIT 许可证 下授权。

引用信息

[需要更多信息]

搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
The GSM8K-Prolog dataset is a Prolog-annotated version of the GSM8K math reasoning dataset, containing grade-school math questions and their Prolog solutions. It includes 8,792 instances split into training (7,473) and test (1,319) sets, aimed at training models to generate Prolog code for solving math problems. The dataset is licensed under MIT and supports tasks in arithmetic reasoning and Prolog code generation.
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作