five

bryanchrist/SGSM

收藏
Hugging Face2024-02-28 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/bryanchrist/SGSM
下载链接
链接失效反馈
官方服务:
资源简介:
SGSM(Synthetic Grade School Math)数据集包含20,490个问题/答案对,由MATHWELL生成,MATHWELL是一个无上下文的数学应用题生成器。数据集分为两个子集:SGSM Train(2,093个经过专家验证的问题/答案对)和SGSM Unannotated(18,397个未经验证但包含可执行代码的问题/答案对)。SGSM是最大的带有程序化思维(PoT)解释的英语小学数学问答数据集,旨在训练无上下文的数学应用题生成器,也可用于训练数学问答模型。

SGSM(Synthetic Grade School Math)数据集包含20,490个问题/答案对,由MATHWELL生成,MATHWELL是一个无上下文的数学应用题生成器。数据集分为两个子集:SGSM Train(2,093个经过专家验证的问题/答案对)和SGSM Unannotated(18,397个未经验证但包含可执行代码的问题/答案对)。SGSM是最大的带有程序化思维(PoT)解释的英语小学数学问答数据集,旨在训练无上下文的数学应用题生成器,也可用于训练数学问答模型。
提供机构:
bryanchrist
原始信息汇总

SGSM 数据集

概述

SGSM(Synthetic Grade School Math)是一个包含20,490个问题/答案对的数据集,由MATHWELL生成。MATHWELL是一个上下文无关的小学数学应用题生成器,能够根据可选的学生兴趣输出应用题和思维过程(PoT)解决方案。

数据集组成

  • SGSM Train:包含2,093个问题/答案对,由人类专家验证。
  • SGSM Unannotated:包含18,397个问题/答案对,具有可执行代码但未经人类专家验证。

特点

  • SGSM是最大的带有PoT推理的英语小学数学QA数据集。

用途

  • 用于训练上下文无关的小学数学应用题生成器。
  • 也可用于训练数学QA模型。

参考文献

bash @misc{christ2024mathwell, title={MATHWELL: Generating Educational Math Word Problems at Scale}, author={Bryan R Christ and Jonathan Kropko and Thomas Hartvigsen}, year={2024}, eprint={2402.15861}, archivePrefix={arXiv}, primaryClass={cs.CL} }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作