bryanchrist/SGSM
收藏Hugging Face2024-02-28 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/bryanchrist/SGSM
下载链接
链接失效反馈官方服务:
资源简介:
SGSM(Synthetic Grade School Math)数据集包含20,490个问题/答案对,由MATHWELL生成,MATHWELL是一个无上下文的数学应用题生成器。数据集分为两个子集:SGSM Train(2,093个经过专家验证的问题/答案对)和SGSM Unannotated(18,397个未经验证但包含可执行代码的问题/答案对)。SGSM是最大的带有程序化思维(PoT)解释的英语小学数学问答数据集,旨在训练无上下文的数学应用题生成器,也可用于训练数学问答模型。
SGSM(Synthetic Grade School Math)数据集包含20,490个问题/答案对,由MATHWELL生成,MATHWELL是一个无上下文的数学应用题生成器。数据集分为两个子集:SGSM Train(2,093个经过专家验证的问题/答案对)和SGSM Unannotated(18,397个未经验证但包含可执行代码的问题/答案对)。SGSM是最大的带有程序化思维(PoT)解释的英语小学数学问答数据集,旨在训练无上下文的数学应用题生成器,也可用于训练数学问答模型。
提供机构:
bryanchrist
原始信息汇总
SGSM 数据集
概述
SGSM(Synthetic Grade School Math)是一个包含20,490个问题/答案对的数据集,由MATHWELL生成。MATHWELL是一个上下文无关的小学数学应用题生成器,能够根据可选的学生兴趣输出应用题和思维过程(PoT)解决方案。
数据集组成
- SGSM Train:包含2,093个问题/答案对,由人类专家验证。
- SGSM Unannotated:包含18,397个问题/答案对,具有可执行代码但未经人类专家验证。
特点
- SGSM是最大的带有PoT推理的英语小学数学QA数据集。
用途
- 用于训练上下文无关的小学数学应用题生成器。
- 也可用于训练数学QA模型。
参考文献
bash @misc{christ2024mathwell, title={MATHWELL: Generating Educational Math Word Problems at Scale}, author={Bryan R Christ and Jonathan Kropko and Thomas Hartvigsen}, year={2024}, eprint={2402.15861}, archivePrefix={arXiv}, primaryClass={cs.CL} }



