lucasmccabe-lmi/codex_math_qa_alpaca_style
收藏Hugging Face2023-04-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/lucasmccabe-lmi/codex_math_qa_alpaca_style
下载链接
链接失效反馈官方服务:
资源简介:
该数据集由`codex-davinci-002`生成的代码响应组成,用于解决来自math_qa数据集的数学问题。此数据集与theblackcat102/codex-math-qa数据集等价,但已稍作修改以适应Alpaca格式。数据集包含28050个提示,使用EleutherAI/gpt-neox-20b分词器计算的令牌数量为6626950。
该数据集由`codex-davinci-002`生成的代码响应组成,用于解决来自math_qa数据集的数学问题。此数据集与theblackcat102/codex-math-qa数据集等价,但已稍作修改以适应Alpaca格式。数据集包含28050个提示,使用EleutherAI/gpt-neox-20b分词器计算的令牌数量为6626950。
提供机构:
lucasmccabe-lmi
原始信息汇总
数据集概述
数据集名称
- 名称: codex_math_qa_alpaca_style
数据集内容
- 生成方式: 由
codex-davinci-002生成代码响应,用于解决数学文字问题。 - 原始数据来源: math_qa
- 格式调整: 为适应Alpaca格式进行了轻微修改。
数据集特征
- 特征名称及类型:
instruction: stringinput: stringoutput: string
数据集拆分
- 训练集:
- 示例数量: 28050
- 字节数: 23778428.0
数据集大小
- 下载大小: 8824844
- 数据集大小: 23778428.0
数据集统计
- 提示数量: 28050
- 令牌数量: 6626950(使用EleutherAI/gpt-neox-20b tokenizer,计数包括instruction+input+output)



