five

kevin009/olympiad-math-contest-llama3-20k

收藏
Hugging Face2024-06-09 更新2024-06-15 收录
下载链接:
https://hf-mirror.com/datasets/kevin009/olympiad-math-contest-llama3-20k
下载链接
链接失效反馈
官方服务:
资源简介:
AMC/AIME数学问题与解答数据集包含20,300个数学问题及其解答,主要来源于MATH数据集、AIME竞赛问题和另一个特定标准筛选的数据集。数据格式为LaTeX,包含问题陈述、逐步解答和额外解释。数据集主要用于研究和AI数学奥林匹克竞赛,目标用户为AI和数学或科学领域的研究人员。数据收集和预处理涉及从多个来源收集问题,并使用Claude 3 Opus优化解答和转换图像为LaTeX格式。数据集涵盖代数、数论、几何和预微积分等多个主题,但分布不均衡。数据集仅用于非商业、教育和研究目的,可能存在错误,用户需遵守原始来源的许可和使用条款。

The AMC/AIME Math Problems and Solutions Dataset consists of 20,300 mathematical problems and their corresponding solutions, primarily sourced from the MATH dataset, AIME competition problems, and another dataset screened against specific criteria. The data is stored in LaTeX format, containing problem statements, step-by-step solutions, and supplementary explanations. This dataset is mainly designed for research and AI mathematics Olympiad-related studies, with target users including researchers in the fields of artificial intelligence, mathematics, and natural sciences. The data collection and preprocessing workflow involves aggregating problems from multiple sources, optimizing the solutions using Claude 3 Opus, and converting images into LaTeX format. The dataset covers multiple subject areas such as algebra, number theory, geometry, and precalculus, yet exhibits an unbalanced distribution across these topics. This dataset is exclusively for non-commercial, educational, and research use. There may exist errors in the dataset, and users are required to abide by the license agreements and usage terms of the original data sources.
提供机构:
kevin009
原始信息汇总

AMC/AIME Mathematics Problem and Solution Dataset

数据集详情

  • 数据集名称: AMC/AIME Mathematics Problem and Solution Dataset
  • 版本: 1.0
  • 发布日期: 2024-06-1
  • 作者: Kevin Amiri

预期用途

  • 主要用途: 该数据集旨在用于研究和AI数学奥林匹克Kaggle竞赛。
  • 预期用户: AI和数学或科学领域的研究人员。

数据集组成

  • 示例数量: 20,300个问题和解决方案集
  • 数据来源:
    • 约10,000个示例来自MATH数据集
    • 约2,700个示例来自以往的AIME问题
    • 2,500个样本根据特定标准从另一个数据集中选择
  • 数据格式: 问题和解决方案以LaTeX格式编排

数据字段

  • 问题: 数学问题陈述
  • 解决方案: 对应问题的逐步解决方案
  • 洞察: 问题和解决方案的额外解释和澄清

数据收集和预处理

  • 收集来源: 问题和解决方案来自AMC和AIME竞赛、MATH数据集、Art of Problem Solving以及根据特定标准选择的另一个数据集。
  • 预处理: 逐步解决方案和洞察部分被添加以优化思维链。Claude 3 Opus用于优化和改进解决方案,并将图像转换为LaTeX格式。约一半的示例通过Claude 3 Opus多次改进,以提高解决方案的质量。

数据分布

  • 涵盖主题: 数据集涵盖了广泛的数学主题,包括代数、数论、几何和微积分预备问题。
  • 多样性: 不同来源的问题分布确保了数据集的多样性。
  • 平衡性: 数据集不平衡,某些主题比其他主题更受代表。该数据集旨在用于自回归大型语言模型的微调。

伦理考虑

  • 用途限制: 数据集仅用于非商业、教育和研究目的。
  • 错误可能性: 数据集未经作者审查,可能存在错误。
  • 归属: 应给予问题和解决方案原始来源的适当归属。
  • 许可: 用户应遵守AMC、AIME和Art of Problem Solving材料的适用许可和使用条款。

局限性和未来工作

  • 覆盖范围: 数据集可能未涵盖数学竞赛中的所有可能问题类型和难度。
  • 未来扩展: 可以考虑进一步扩展数据集,包括更多多样化的问题和解决方案。
搜集汇总
数据集介绍
main_image_url
构建方式
在数学竞赛与人工智能交叉研究领域,数据集的构建需兼顾问题多样性与解答严谨性。本数据集通过整合多个权威来源,包括MATH数据集中的约一万个样例、美国数学邀请赛(AIME)历史题目约两千七百道,以及依据特定标准从其他数据集中筛选的两千五百个样本,形成了总计两万零三百道题目及其解答的集合。数据预处理阶段,利用Claude 3 Opus模型对约半数样例进行多步骤优化,添加逐步解答与深入解析,并将图像内容转换为LaTeX格式,以增强链式推理的适用性。
特点
该数据集以LaTeX格式呈现数学问题与解答,覆盖代数、数论、几何及微积分预备知识等多个主题,展现了数学竞赛题目的广泛性。其核心特点在于每道题目均配备逐步解答与额外解析,旨在模拟人类解题的思维过程,为语言模型的链式推理训练提供结构化支持。数据分布虽未刻意平衡,但来源的多样性确保了题目类型与难度的丰富层次,适用于自回归大语言模型的精细化调优。
使用方法
本数据集专为数学与人工智能领域的研究设计,尤其适用于训练语言模型解决复杂数学问题。使用者可通过加载数据集中的问题与解答对,进行监督学习或链式推理任务的模型微调。在应用过程中,需注意数据可能存在未经人工复核的误差,建议结合验证集评估模型输出。同时,应遵循原始材料的相关许可协议,确保在教育与研究用途中合理引用来源,以维护学术规范性。
背景与挑战
背景概述
在人工智能与数学交叉研究领域,数学竞赛问题求解一直是评估模型复杂推理能力的关键基准。2024年6月,由Kevin Amiri发布的AMC/AIME数学竞赛问题与解答数据集,旨在为大型语言模型的微调提供高质量资源。该数据集汇集了超过两万道来自美国数学竞赛(AMC)和美国数学邀请赛(AIME)的题目,涵盖代数、数论、几何及微积分预备知识等多个主题。其核心研究问题聚焦于提升模型在链式思维推理下的数学问题解决能力,通过融合MATH数据集、AoPS社区资源及特定筛选样本,为后续的Kaggle竞赛与学术探索奠定了数据基础。
当前挑战
该数据集致力于应对数学竞赛级别问题自动求解的挑战,其难点在于题目往往需要多步骤、深层次的逻辑推导与符号运算,对模型的抽象理解与形式化表达能力提出了极高要求。在构建过程中,挑战主要体现在数据质量的优化与格式统一:原始题目来源多样,部分涉及图像形式的数学表达式,需借助Claude 3 Opus模型将其转化为LaTeX格式;同时,为增强解答的清晰度与教育价值,需人工或半自动地补充步骤详解与洞察分析,这一过程虽提升了数据集的可用性,但也引入了潜在的错误风险与主题覆盖不均衡的问题。
常用场景
经典使用场景
在数学竞赛与人工智能交叉领域,该数据集为大型语言模型的微调提供了核心资源。其经典使用场景聚焦于通过链式思维优化方法,训练模型解决代数、数论、几何及预微积分等复杂数学问题。研究者利用数据集中的问题陈述、逐步解答及深入解析,模拟人类推理过程,旨在提升模型在数学奥林匹克竞赛题目上的自动求解能力,推动AI在高级数学推理任务中的性能边界。
解决学术问题
该数据集有效应对了人工智能在数学推理研究中面临的若干挑战,特别是模型缺乏结构化、逐步推演能力的问题。通过提供大量来自AMC/AIME竞赛及MATH数据集的LaTeX格式问题与解答,它支持研究者探索链式思维提示、自动解题生成及数学语言理解等关键方向。其意义在于为评估和提升模型在复杂数学领域的泛化与推理性能建立了标准化基准,促进了AI与数学教育研究的深度融合。
衍生相关工作
围绕该数据集,已衍生出多项经典研究工作,主要集中在数学专用语言模型的微调与评估框架上。例如,基于链式思维优化的模型训练方法,通过模仿数据集中提供的逐步解答逻辑,显著提升了模型在复杂数学问题上的推理准确性。此外,该数据集也常被用作基准测试的一部分,支持了多项关于数学问题自动生成、解答质量评估及跨领域知识迁移的研究,丰富了AI数学推理领域的学术成果。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作