five

theblackcat102/codex-math-qa

收藏
Hugging Face2023-03-26 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/theblackcat102/codex-math-qa
下载链接
链接失效反馈
官方服务:
资源简介:
Codex Math QA数据集旨在通过Python编程解决数学问题。该数据集使用了OpenAI的code-davinci-002模型生成代码,但由于该模型已被关闭,数据集提供了生成结果的参考。数据集包含两个部分:基本提示和带有推理的提示。基本提示仅包含问题,而带有推理的提示包含问题及其推理过程。数据集来源于math_qa,并附加了生成Python解决方案的提示。数据集的生成配置包括max_tokens、temperature和top_p等参数。数据集中的生成结果未经验证,可能存在错误和语法问题。
提供机构:
theblackcat102
原始信息汇总

数据集概述

数据集名称

  • Codex Math QA

数据集描述

  • 该数据集使用codex-davinci-002模型通过Python编程解决数学问题。

数据集用途

  • 分享codex-davinci-002模型的代码生成结果,特别是在OpenAI决定关闭code-davinci-002模型后。

数据集语言

  • 英语 (en)

数据集任务类别

  • 文本到文本生成 (text2text-generation)
  • 文本生成 (text-generation)

数据集标签

  • codex-generated
  • code
  • mathematic

数据集分片

  • main
    • 训练集: 25065
    • 验证集: 4133
    • 测试集: 2985
  • rational
    • 验证集: 4151
    • 测试集: 2985

数据集示例

  • 基本提示:仅包含问题。
  • 带理由的提示:包含帮助编程计划的Rationale文本。

数据集生成配置

  • max_tokens: 2048
  • temperature: 0.5
  • top_p: 0.7

数据集注意事项

  • 生成的结果未经验证,包含大量错误答案和语法错误的代码。

数据集来源

  • 数据集来源于math_qa,并在问题后附加提示以生成Python解决方案。

引用信息

@inproceedings{amini-etal-2019-mathqa, title = "{M}ath{QA}: Towards Interpretable Math Word Problem Solving with Operation-Based Formalisms", author = "Amini, Aida and Gabriel, Saadia and Lin, Shanchuan and Koncel-Kedziorski, Rik and Choi, Yejin and Hajishirzi, Hannaneh", booktitle = "Proceedings of the 2019 Conference of the North {A}merican Chapter of the Association for Computational Linguistics: Human Language Technologies, Volume 1 (Long and Short Papers)", month = jun, year = "2019", address = "Minneapolis, Minnesota", publisher = "Association for Computational Linguistics", url = "https://aclanthology.org/N19-1245", doi = "10.18653/v1/N19-1245", pages = "2357--2367", }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作