AWPCD
收藏Hugging Face2025-01-30 更新2025-02-10 收录
下载链接:
https://huggingface.co/datasets/HelloCephalopod/AWPCD
下载链接
链接失效反馈官方服务:
资源简介:
Arithmetic Word Problem Compendium Dataset (AWPCD) 是一个包含多个领域的数学应用题的综合集合,具有丰富的元数据和自然语言变体。问题包含1到5步的数学运算,旨在鼓励展示计算过程并保持适当的小数精度。数据集包含2000个文件,分为训练集和评估集,每个文件以JSONL格式提供,包含问题的文本、元数据以及解决方案。数据集可用于预训练、指令调优、微调和基准测试,主要用于训练数学推理系统、开发逐步解决问题的能力、测试不同现实场景中的算术运算以及评估小数计算的精度。数据集的局限性包括仅支持英语、仅限于特定数学运算、模板生成可能引入结构模式以及最多涉及5个数字的算术运算。
创建时间:
2025-01-29
原始信息汇总
数据集概述
数据集基本信息
- 数据集名称:Arithmetic Word Problem Compendium Dataset (AWPCD)
- 语言:英语
- 许可:MIT
- 标签:数学、文字问题、算术、教育
数据集描述
- 数据集简介:该数据集是涵盖多个领域的数学文字问题的全面集合,包含丰富的元数据和自然语言变体。问题包含1-5步的数学运算,特别设计以鼓励展示计算过程并保持适当的十进制精度。
- 数据规模:包含1000个问题的样本,商业选项可用于获取100,000至10百万问题的数据集或授权使用生成数据的模板系统。
- 用途与限制:数据集可用于预训练、指令微调、微调和基准测试现有模型,主要用于训练数学推理系统、开发分步解决问题的能力、测试各种实际场景下的算术运算和评估十进制计算的精度。限制包括仅限英语、限于特定数学运算、基于模板的生成可能引入结构模式、专注于最多包含5个数字的算术运算。
数据集结构
- 文件总数:2000个文件(训练集1000个文件,评估集1000个文件)
- 问题领域:包括农业、体育、建筑、烹饪、教育、娱乐、金融等多个领域
- 数据格式:每个示例以JSONL格式提供,包含问题、元数据和解决方案
样本数据
- 训练示例:提供三个训练示例,涉及金融账户管理、农业粮食储存和温度监测等领域。
- 评估示例:提供三个评估示例,展示如何逐步解决问题。
特征
- 每个问题包括唯一的问题ID、自然语言问题文本、涉及小数和整数的算术运算、详细的元数据(包括领域分类、对象类型和单位、数值、数学运算符、解决方案值、离散标志、十进制精度和定制数值范围)。
测试
- 仓库包含在
testing目录下的综合评估脚本,用于评估模型性能的多个维度,包括答案准确性、分步验证、十进制精度和领域性能。
引用
bibtex @dataset{cephalopod_math_word_problems_2025, title={Arithmetic Word Problem Compendium Dataset}, year={2025}, publisher={Cephalopod Studio LLC} }
许可
- 数据集根据MIT许可进行授权。
额外信息
- 对于商业用例,Cephalopod Studio提供定制解决方案,包括定制数据集(100,000至10百万问题)和授权模板引擎。
联系方式
- hello@cephalopod.studio
搜集汇总
数据集介绍

构建方式
AWPCD数据集的构建是通过模板系统生成,涵盖了数学文字问题在多个领域的丰富元数据和自然语言变体。该数据集中的问题专门设计为1至5步的数学运算,以鼓励展示计算过程,并在整个计算过程中保持适当的十进制精度。
特点
AWPCD数据集的特点在于其包含了多个领域(如农业、体育、建筑、烹饪等)的数学问题,每个问题都有独特的ID、自然语言描述的问题文本以及详细的元数据。元数据包括领域分类、对象类型和单位、使用的数值、数学运算符、解的值、离散标志、十进制精度和定制数值范围。
使用方法
使用AWPCD数据集时,用户可以根据数据集提供的训练集和评估集进行模型的预训练、指令调整、微调和性能基准测试。数据集以JSONL格式提供,每个示例包括问题及其元数据和相应的解决方案文件,方便模型训练和评估过程中的精确度控制和步骤验证。
背景与挑战
背景概述
AWPCD(Arithmetic Word Problem Compendium Dataset)数据集由Cephalopod Studio LLC于2025年创建,是一组涵盖多个领域的数学文字问题的全面集合,含有丰富的元数据和自然语言变化。该数据集的构建旨在训练数学推理系统,发展分步骤问题解决能力,并在各种现实世界背景下测试算术运算,评估小数计算的精确度。该数据集的创建对于数学教育、自然语言处理以及人工智能领域的研究具有显著影响,为相关领域的研究人员提供了重要的资源。
当前挑战
AWPCD数据集面临的挑战主要包括:1)领域局限性,目前数据集仅限于特定数学运算且为英语独占,限制了其在多语言和多数学领域的应用;2)数据集构建过程中,模板生成的结构可能引入模式化的结构特征,这可能会影响模型学习到的多样性和泛化能力;3)数据集规模相对有限,尽管商业选项提供了扩展到更大规模数据集的可能性,但大规模应用的成本可能成为一项挑战。
常用场景
经典使用场景
AWPCD数据集是数学文字问题的综合集合,旨在促进数学推理系统的训练与发展。其经典使用场景包括数学模型的预训练、指令微调、细化调整以及现有模型的基准测试,从而推动数学问题解决能力的逐步完善。
衍生相关工作
基于AWPCD数据集,研究者们已经衍生出一系列相关工作,如开发自动评分系统、设计更复杂的数学问题生成算法以及探索数学问题解决中的认知过程,进一步拓宽了数据集的应用范围与影响力。
数据集最近研究
最新研究方向
AWPCD数据集作为数学文字问题的综合集合,近期研究主要集中在利用该数据集对数学推理系统进行预训练、指导性调整、微调以及现有模型的基准测试。这些研究旨在培养数学推理系统逐步解决问题的能力,并在各种现实世界情境中测试算术运算的准确性和精度。学者们正深入探讨如何通过该数据集优化模型的算术推理过程,并提高其在不同领域的应用性能,例如金融、农业、建筑和教育等。此外,研究还关注如何克服模板生成数据可能引入的结构模式限制,以及如何提升模型对具有小数运算和精确度要求的问题的处理能力。
以上内容由遇见数据集搜集并总结生成



