NuminaMath-CoT|数学教育数据集|思维链技术数据集
收藏huggingface2024-07-19 更新2024-12-12 收录
下载链接:
https://huggingface.co/datasets/AI-MO/NuminaMath-CoT
下载链接
链接失效反馈资源简介:
数据集包含约86万道数学题目,每道题目的解答都采用思维链(Chain of Thought, CoT)格式。数据来源包括中国高中数学练习题以及美国和国际数学奥林匹克竞赛题目。数据主要从在线考试试卷PDF和数学讨论论坛收集。处理步骤包括从原始PDF中进行OCR识别、分割成问题-解答对、翻译成英文、重新对齐以生成CoT推理格式,以及最终答案格式化。
创建时间:
2024-07-16
原始信息汇总
数据集卡片 for NuminaMath CoT
数据集描述
数据集概述
大约包含86万个数学问题,每个解决方案都以思维链(Chain of Thought, CoT)的方式格式化。数据集的来源包括中国高中数学练习题、美国和国际数学奥林匹克竞赛问题。数据主要从在线考试试卷PDF和数学讨论论坛收集。处理步骤包括(a)从原始PDF进行OCR识别,(b)分割成问题-解决方案对,(c)翻译成英语,(d)重新对齐以生成CoT推理格式,以及(e)最终答案格式化。
来源细分
| 来源 | 样本数量 |
|---|---|
| aops_forum | 30201 |
| amc_aime | 4072 |
| cn_k12 | 276591 |
| gsm8k | 7345 |
| math | 7478 |
| olympiads | 150581 |
| orca_math | 153334 |
| synthetic_amc | 62111 |
| synthetic_math | 167895 |
| 总计 | 859608 |
许可信息
数据集在Creative Commons NonCommercial (CC BY-NC 4.0)许可下可用。
引用信息
@misc{numina_math_datasets, author = {Jia LI and Edward Beeching and Lewis Tunstall and Ben Lipkin and Roman Soletskyi and Shengyi Costa Huang and Kashif Rasul and Longhui Yu and Albert Jiang and Ziju Shen and Zihan Qin and Bin Dong and Li Zhou and Yann Fleureau and Guillaume Lample and Stanislas Polu}, title = {NuminaMath}, year = {2024}, publisher = {Numina}, journal = {Hugging Face repository}, howpublished = {url{https://huggingface.co/AI-MO/NuminaMath-CoT}} }
AI搜集汇总
数据集介绍

构建方式
NuminaMath-CoT数据集的构建过程体现了多源数据整合与精细处理的科学方法。数据主要来源于在线考试试卷PDF和数学讨论论坛,涵盖了从中国高中数学练习题到美国及国际数学奥林匹克竞赛题目的广泛内容。构建过程中,首先通过OCR技术从原始PDF中提取文本,随后将文本分割为问题-解答对,并进行英文翻译。接着,数据被重新对齐以生成链式思维(CoT)推理格式,并最终格式化答案。这一系列步骤确保了数据的高质量和一致性。
特点
NuminaMath-CoT数据集以其丰富的内容和独特的链式思维推理格式脱颖而出。数据集包含约86万道数学问题,每道问题的解答均以链式思维形式呈现,有助于深入理解解题过程。数据来源多样,涵盖了中国高中数学、国际数学竞赛等多个领域,确保了数据的广泛性和代表性。此外,数据集还提供了详细的问题来源分类,便于用户根据需求选择特定类型的问题进行研究或训练。
使用方法
NuminaMath-CoT数据集适用于多种自然语言处理和数学推理任务。用户可以通过Hugging Face平台下载数据集,并根据需要选择训练集或测试集进行使用。数据集的结构清晰,包含问题、解答以及链式思维推理的详细步骤,便于直接应用于模型训练或评估。此外,数据集的开源许可证(Apache 2.0)允许用户自由使用、修改和分发数据,进一步推动了其在学术研究和工业应用中的广泛应用。
背景与挑战
背景概述
NuminaMath-CoT数据集由Numina团队于2024年发布,旨在推动数学问题求解领域的研究,特别是基于链式思维(Chain of Thought, CoT)的推理方法。该数据集包含了约86万道数学问题,涵盖从中国高中数学习题到美国及国际数学奥林匹克竞赛题目的广泛来源。数据主要通过在线考试试卷PDF和数学讨论论坛收集,并经过OCR、问题-解答对分割、翻译、CoT格式对齐等复杂处理步骤。该数据集的发布为数学推理模型的训练与评估提供了丰富的资源,显著推动了自动数学问题求解领域的发展。
当前挑战
NuminaMath-CoT数据集在构建与应用中面临多重挑战。首先,数学问题的多样性与复杂性要求模型具备强大的推理能力,尤其是在处理高难度竞赛题目时,模型需要精确捕捉问题中的逻辑关系。其次,数据集的构建过程涉及大量人工干预,包括OCR识别、翻译与格式对齐,这些步骤不仅耗时且容易引入误差。此外,尽管数据集规模庞大,但其来源的多样性与质量差异可能导致模型训练的不均衡性,进而影响泛化能力。最后,如何将链式思维推理方法有效应用于实际数学问题求解,仍是当前研究中的核心挑战之一。
常用场景
经典使用场景
NuminaMath-CoT数据集广泛应用于数学问题的自动求解和推理任务中。其独特的Chain of Thought(CoT)格式使得模型能够逐步推理并生成详细的解题步骤,特别适用于数学竞赛题、高中数学习题等复杂问题的求解。研究人员利用该数据集训练和评估模型在数学推理任务中的表现,推动自动推理技术的发展。
衍生相关工作
NuminaMath-CoT数据集催生了一系列相关研究工作。例如,基于该数据集的研究推动了Chain of Thought推理方法在数学领域的应用,并衍生出多种改进模型,如结合强化学习的推理模型和多模态数学推理系统。此外,该数据集还被用于探索数学推理与自然语言处理的交叉领域,为数学自动推理技术的进一步发展提供了重要参考。
数据集最近研究
最新研究方向
在数学问题求解领域,NuminaMath-CoT数据集以其独特的链式思维(CoT)格式,为自动推理和数学问题求解模型提供了丰富的训练资源。该数据集涵盖了从中国高中数学练习题到国际数学奥林匹克竞赛题目的广泛内容,使得研究者能够探索不同难度和类型的数学问题。近年来,随着大语言模型在数学推理任务中的应用日益增多,NuminaMath-CoT数据集成为了评估和改进这些模型的关键工具。特别是在自动推理、多步问题求解以及跨语言数学问题处理方面,该数据集的研究方向主要集中在如何通过CoT格式提升模型的推理能力和泛化性能。此外,该数据集还为数学教育技术的研究提供了新的视角,推动了智能辅导系统和个性化学习工具的发展。
以上内容由AI搜集并总结生成
