five

FATE-X

收藏
github2025-08-26 更新2025-08-28 收录
下载链接:
https://github.com/frenzymath/FATE-X
下载链接
链接失效反馈
官方服务:
资源简介:
FATE-X(形式代数定理评估-超难)基准测试集,包含100个极具挑战性的抽象代数和交换代数练习,收集自本科和研究生教材、期末考试和博士资格考试以及研究文献。所有练习均使用Lean形式化,提供JSON格式的数据文件,包含问题ID、形式化陈述、自然语言陈述、基准来源和数学领域标签等信息

The FATE-X (Formally Algebraic Theorem Evaluation - Extreme) benchmark dataset consists of 100 highly challenging exercises in abstract algebra and commutative algebra, collected from undergraduate and graduate textbooks, final examinations, doctoral qualifying examinations, and research literature. All exercises are formalized using the Lean theorem prover. JSON-formatted data files are provided, which contain information such as problem ID, formalized statement, natural language statement, benchmark source, and mathematical domain tags.
创建时间:
2025-07-28
原始信息汇总

FATE-X 数据集概述

数据集简介

FATE-X(Formal Algebra Theorem Evaluation - Extra Hard)基准测试包含100个极具挑战性的抽象代数和交换代数练习题,来源包括本科和研究生教材、期末考试和博士资格考试以及研究文献。

数据集内容

  • 所有练习均使用Lean形式化
  • 提供JSON文件(FATE-X.json),每个条目包含:
    • 问题ID
    • 形式化陈述(Lean代码)
    • 自然语言陈述
    • 基准测试来源(FATE-X)
    • 数学领域标签

基准结构

每个Lean文件包含:

  • 一个完全形式化的陈述
  • 单个sorry
  • 开头适当的开放命名空间
  • 陈述前最小化依赖定义的形式化
  • 陈述前的自然语言注释

数学分类分布

数据集包含数学分类分布图表,详见:https://raw.githubusercontent.com/frenzymath/FATE-X/main/assets/FATE-X-sunburst.svg

工具链

初始版本使用leanprover/lean4:v4.19.0,未来版本可能更新

参考资料

完整练习列表(自然语言和Lean代码)详见FATE-X.pdf文件

搜集汇总
数据集介绍
main_image_url
构建方式
在抽象代数与交换代数领域,FATE-X数据集的构建依托于严谨的学术资源整合,从本科及研究生教材、期末考试与博士资格考试题目以及研究文献中精选了100道极具挑战性的习题。每道题目均通过Lean定理证明器进行形式化处理,确保数学陈述的精确性与逻辑严密性。数据集以JSON格式组织,每条记录包含问题标识、形式化陈述、自然语言描述及数学领域标签,体现了多源学术资料的系统化编码与标准化处理。
特点
FATE-X数据集的核心特点在于其高阶难度与形式化表达的深度结合,专注于抽象代数与交换代数中复杂性较高的理论问题。该数据集通过Lean代码实现完全形式化,每个问题均附带自然语言注释,支持跨模态数学推理研究。其独特的结构设计——每文件仅含单一形式化命题与一个待证明目标(`sorry`),兼顾了数学严谨性与计算可处理性,为自动化定理证明提供了高质量的基准测试环境。
使用方法
研究者可通过解析提供的JSON文件获取结构化问题数据,结合Lean工具链(v4.19.0及以上版本)进行形式化验证与定理证明实验。数据集支持多种应用场景:既可作为机器学习模型训练中数学推理能力的评估基准,也可用于研究形式化数学语言与自然语言之间的语义对齐。用户需依据自然语言注释理解数学内涵,并利用Lean环境完成形式化填补,从而推动自动化推理与交互式定理证明的技术前沿。
背景与挑战
背景概述
在形式化数学领域的发展进程中,FATE-X数据集由FrenzyMath研究团队于2024年创建,致力于解决抽象代数与交换代数中高阶定理的形式化验证问题。该数据集源自本科至博士阶段的经典教材、资格考试及前沿研究文献,通过Lean定理证明器实现了100个极端复杂命题的形式化编码。其核心价值在于推动计算机辅助证明系统在高等代数领域的应用深度,为自动化推理算法提供了严格的评估基准,显著促进了形式化数学与计算机科学的跨学科融合。
当前挑战
该数据集首要挑战在于解决抽象代数定理机器验证的语义鸿沟问题,需将高度抽象的数学概念转化为精确的形式化语言。构建过程中面临双重困难:其一是数学结构的形式化建模,如环论与模论中非直观概念的Lean编码;其二是保持原命题的数学严谨性同时满足证明器语法约束,需在定义最小化依赖与命名空间管理的平衡中反复优化。此外,跨领域知识融合要求团队成员同时具备深度的代数学修养和形式化验证工程能力。
常用场景
经典使用场景
在形式化数学与自动定理证明领域,FATE-X数据集作为高阶代数问题的验证基准,主要应用于测试定理证明系统的推理能力。研究者通过该数据集评估自动化证明工具在处理抽象代数、交换代数等复杂数学结构时的性能表现,尤其在处理研究生级别数学问题时展现其独特价值。该数据集为形式化数学社区提供了标准化评估框架,推动定理证明技术向更深层次的数学领域拓展。
解决学术问题
FATE-X有效解决了形式化数学中高阶代数定理机器验证的难题,为自动化推理系统提供了严格的评估标准。该数据集通过涵盖教科书、资格考试及研究文献中的精选问题,填补了复杂代数问题形式化验证的空白,显著提升了定理证明系统在抽象数学领域的适用性。其建立促进了形式化方法与现代代数研究的深度融合,为数学定理的机器辅助证明奠定了坚实基础。
衍生相关工作
基于FATE-X数据集已衍生出多项重要研究,包括神经网络引导的定理证明策略、形式化数学知识库的构建方法以及自动化推理系统的评估框架。这些工作显著推进了机器证明在抽象代数领域的发展,其中部分成果已被集成到主流定理证明器中。该数据集还激发了跨学科合作,促进了计算机科学与数学在形式化验证方面的深度融合与创新。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作