FATE-H (Formal Algebra Theorem Evaluation - Hard)

github2025-08-26 更新2025-08-28 收录

下载链接：

https://github.com/frenzymath/FATE-H

下载链接

链接失效反馈

官方服务：

资源简介：

FATE-H（形式代数定理评估-困难）基准测试集，包含100个具有挑战性的抽象代数和交换代数练习，收集自本科和研究生教材、期末考试和博士资格考试以及研究文献。所有练习都用Lean形式化，提供JSON格式的数据文件，每个条目包含问题ID、形式化陈述（Lean代码）、自然语言陈述、基准来源和数学领域标签

FATE-H (Formal Algebra Theorem Evaluation - Hard) benchmark dataset contains 100 challenging exercises in abstract algebra and commutative algebra, collected from undergraduate and graduate textbooks, final examinations, doctoral qualifying examinations, and research literature. All exercises are formalized in Lean, with JSON-format data files provided. Each entry includes a problem ID, formal statement (Lean code), natural language statement, benchmark source, and mathematical domain tag.

创建时间：

2025-07-28

原始信息汇总

FATE-H 数据集概述

数据集简介

FATE-H（Formal Algebra Theorem Evaluation - Hard）是一个包含100个具有挑战性的抽象代数和交换代数练习的基准测试集。这些练习来源于本科和研究生教材、期末考试和博士资格考试以及研究文献。

数据内容

所有练习均使用Lean定理证明器进行形式化
提供JSON格式文件（FATE-H.json），每个条目包含：
- 问题ID
- 形式化陈述（Lean代码）
- 自然语言陈述
- 基准测试来源（FATE-H）
- 数学领域标签

文件结构

每个Lean文件包含：

一个完全形式化的陈述
单个sorry占位符
开头适当的开放命名空间
陈述前的自然语言注释

数学分类分布

数据集包含数学分类分布的可视化图表，具体分布情况参见：https://raw.githubusercontent.com/frenzymath/FATE-H/main/assets/FATE-H-sunburst.svg

技术规范

初始版本使用leanprover/lean4:v4.16.0工具链
未来更新可能会更改工具链版本

参考资料

完整的问题列表（包含自然语言和Lean代码）详见FATE-H.pdf文件。

搜集汇总

数据集介绍

构建方式

在抽象代数与交换代数领域，FATE-H数据集的构建过程体现了严谨的学术标准。该数据集从本科及研究生教材、期末考试与博士资格考试题、以及研究文献中精选了100道高难度习题，确保题目具有代表性与挑战性。每道题目均通过Lean语言进行形式化编码，包含完整的自然语言描述与Lean代码，并通过统一的JSON结构存储问题ID、形式化陈述、自然语言陈述、来源及数学领域标签，保证了数据的一致性与可追溯性。

特点

FATE-H数据集的核心特点在于其高度形式化与学科深度。所有题目均基于Lean定理证明器实现，每份文件仅包含一个形式化命题与对应的自然语言注释，结构简洁而精确。其数学内容覆盖环论、模论、域论等核心代数分支，并通过可视化统计图表呈现学科分布，为研究者提供清晰的领域概览。数据集采用稳定的Lean工具链（v4.16.0）构建，确保了代码的可靠性与复现性。

使用方法

该数据集的使用需依托Lean定理证明环境，用户可通过解析提供的JSON文件或直接调用Lean代码进行访问。每道习题以独立文件形式组织，包含待证明的形式化命题（标记为`sorry`）及前置命名空间声明，支持用户直接开展形式化验证或自动推理研究。自然语言注释与形式化代码的对照设计，便于跨模态研究与数学教育应用，同时JSON格式的元数据为批量处理与分类分析提供了便利。

背景与挑战

背景概述

形式化代数定理评估基准FATE-H由数学与计算机科学交叉研究团队于2024年创建，旨在推动自动定理证明领域的发展。该数据集聚焦抽象代数与交换代数中的高阶定理形式化，收录来自本科至博士阶段权威教材、资格考试及研究文献的100个核心命题。通过Lean定理证明器实现严格形式化，其构建显著提升了代数结构机器验证的可靠性，为数学人工智能系统提供了重要的评估标准。

当前挑战

该数据集致力于解决形式化数学中复杂代数定理的自动证明挑战，其核心难点在于高阶数学概念的形式化表示与证明策略生成。构建过程中面临双重挑战：一方面需要将自然语言描述的抽象代数概念精确转化为Lean代码，另一方面需保持数学原命题的严谨性而不引入语义偏差。数据采集过程需协调数学领域专家与形式化验证专家的跨学科协作，确保每个命题既符合数学规范又满足机器可验证性要求。

常用场景

经典使用场景

在形式化数学与自动定理证明领域，FATE-H数据集为测试高级定理证明系统的能力提供了标准化的评估框架。研究者通常利用该数据集验证自动化证明助手在抽象代数和交换代数领域的演绎能力，特别是在处理环论、模论与同调代数等复杂概念时的表现。通过将自然语言命题转化为Lean语言形式化表述，该数据集成为衡量数学推理系统泛化性能的重要试金石。

衍生相关工作

基于FATE-H数据集衍生的经典工作包括Lean4证明环境的增强型战术库开发，以及结合大型语言模型的定理自动证明框架。多项研究利用该数据集训练神经证明器，实现了在交换代数领域的证明搜索优化。此外，该数据集还催生了形式化数学知识图谱的构建项目，为代数结构的机器可理解表征建立了新的范式。

数据集最近研究