theblackcat102/codex-math-qa
收藏Hugging Face2023-03-26 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/theblackcat102/codex-math-qa
下载链接
链接失效反馈官方服务:
资源简介:
Codex Math QA数据集旨在通过Python编程解决数学问题。该数据集使用了OpenAI的code-davinci-002模型生成代码,但由于该模型已被关闭,数据集提供了生成结果的参考。数据集包含两个部分:基本提示和带有推理的提示。基本提示仅包含问题,而带有推理的提示包含问题及其推理过程。数据集来源于math_qa,并附加了生成Python解决方案的提示。数据集的生成配置包括max_tokens、temperature和top_p等参数。数据集中的生成结果未经验证,可能存在错误和语法问题。
提供机构:
theblackcat102
原始信息汇总
数据集概述
数据集名称
- Codex Math QA
数据集描述
- 该数据集使用
codex-davinci-002模型通过Python编程解决数学问题。
数据集用途
- 分享
codex-davinci-002模型的代码生成结果,特别是在OpenAI决定关闭code-davinci-002模型后。
数据集语言
- 英语 (
en)
数据集任务类别
- 文本到文本生成 (
text2text-generation) - 文本生成 (
text-generation)
数据集标签
codex-generatedcodemathematic
数据集分片
- main
- 训练集: 25065
- 验证集: 4133
- 测试集: 2985
- rational
- 验证集: 4151
- 测试集: 2985
数据集示例
- 基本提示:仅包含问题。
- 带理由的提示:包含帮助编程计划的
Rationale文本。
数据集生成配置
max_tokens: 2048temperature: 0.5top_p: 0.7
数据集注意事项
- 生成的结果未经验证,包含大量错误答案和语法错误的代码。
数据集来源
- 数据集来源于math_qa,并在问题后附加提示以生成Python解决方案。
引用信息
@inproceedings{amini-etal-2019-mathqa, title = "{M}ath{QA}: Towards Interpretable Math Word Problem Solving with Operation-Based Formalisms", author = "Amini, Aida and Gabriel, Saadia and Lin, Shanchuan and Koncel-Kedziorski, Rik and Choi, Yejin and Hajishirzi, Hannaneh", booktitle = "Proceedings of the 2019 Conference of the North {A}merican Chapter of the Association for Computational Linguistics: Human Language Technologies, Volume 1 (Long and Short Papers)", month = jun, year = "2019", address = "Minneapolis, Minnesota", publisher = "Association for Computational Linguistics", url = "https://aclanthology.org/N19-1245", doi = "10.18653/v1/N19-1245", pages = "2357--2367", }



