mathcamps/mathcamps
收藏Hugging Face2024-06-25 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/mathcamps/mathcamps
下载链接
链接失效反馈官方服务:
资源简介:
MathCAMPS是一个基于美国广泛使用的教育课程Mathematics Common Core生成的数学应用题数据集。每个问题都与K-8年级的特定标准相关联,允许对语言模型中的数学技能进行详细评估和分析。数据集包含9707个问题(4900个原始问题和4707个后续问题),覆盖了44个不同的Common Core标准。每个问题都有唯一的标识符、所属标准、问题陈述、预期答案、问题类型(原始问题、增量后续问题或反事实后续问题)以及如果是后续问题,则包含其对应的原始问题的标识符。
MathCAMPS is a dataset of synthetic math word problems derived from the Mathematics Common Core, a widely used curriculum in schools in the US. Each problem is tied to a particular standard from grades K-8, allowing a detailed evaluation and analysis of mathematical skills in language models. The dataset contains 9707 total problems (4900 original problems and 4707 follow-up problems) from 44 distinct Common Core standards. Each problem has a unique identifier, the standard it belongs to, the problem statement, the expected answer, the type of problem (original-problem, incremental-follow-up, or counterfactual-followup), and if it is a follow-up problem, the ID of the problem it follows up on.
提供机构:
mathcamps
原始信息汇总
MathCAMPS - 数学问题数据集
概述
MathCAMPS 是一个从美国广泛使用的教育课程 Mathematics Common Core 中衍生出的合成数学问题数据集。该数据集中的每个问题都与 K-8 年级中的某个特定标准相关联,允许对语言模型中的数学技能进行详细评估和分析。
与其他数据集的区别
- 合成性:可以按需大规模生成新问题,确保无测试集污染。
- 可扩展性:计划通过涵盖更多 Common Core 标准来扩展数据集的范围,包括需要多模态推理的问题。
- 后续问题:除了数学问题外,还可以生成每个问题的后续问题,允许在“数学对话”环境中评估语言模型。
问题和模型响应
MathCAMPS v1.0 包含 9707 个问题(4900 个原始问题和 4707 个后续问题),来自 44 个不同的 Common Core 标准。问题可以在 problems/v1/mathcamps.json 中找到。每个问题是一个对象,包含以下字段:
id:唯一问题标识符standard:问题所属的 Common Core 标准 IDstatement:自然语言描述的问题陈述answer:预期的最终答案type:问题类型(original-problem, incremental-follow-up 或 counterfactual-followup)followup-to:如果类型不是 original-followup,则为该问题后续的问题 ID,否则为 null
示例: json { "id": "2.MD.C.8-0-0", "standard": "2.MD.C.8", "statement": "Liam had $90 in twenties, tens and fives. He spent $81 on a new video game. How much money in dollars does Liam have left?", "answer": "9", "type": "original-problem", "followup_to": null }
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



