HOLSTEP

Name: HOLSTEP
Creator: 因斯布鲁克大学
Published: 2017-03-02 02:20:19
License: 暂无描述

arXiv2017-03-02 更新2024-06-21 收录

下载链接：

http://cl-informatik.uibk.ac.at/cek/holstep/

下载链接

链接失效反馈

官方服务：

资源简介：

HOLSTEP数据集由因斯布鲁克大学开发，专注于高阶逻辑定理证明，包含2,013,046个训练样本和196,030个测试样本，源自11,400个证明。数据集涵盖基础数学、分析、三角学及图等数据结构的推理。创建过程涉及从HOL Light定理证明器中提取证明步骤，并进行离线处理以提取依赖关系和标记训练测试样本。该数据集旨在通过机器学习技术改进定理证明策略，特别是在交互式定理证明系统中提高自动化证明搜索的效率。

The HOLSTEP dataset, developed by the University of Innsbruck, focuses on higher-order logic theorem proving. It contains 2,013,046 training samples and 196,030 test samples, derived from 11,400 formal proofs. The dataset covers reasoning over data structures including foundational mathematics, analysis, trigonometry, and graphs. Its creation involves extracting proof steps from the HOL Light theorem prover, followed by offline processing to extract dependency relationships and label training and test samples. This dataset aims to improve theorem proving strategies via machine learning techniques, particularly to enhance the efficiency of automated proof search in interactive theorem proving systems.

提供机构：

因斯布鲁克大学

创建时间：

2017-03-02

搜集汇总

数据集介绍

构建方式

在交互式定理证明领域，HOLSTEP数据集的构建依托于HOL Light定理证明器，采用LCF架构确保推理步骤的可靠提取。通过记录内核级推理轨迹，数据集从多元分析库及开普勒猜想等形式化证明中，筛选出包含充分使用与未使用步骤的非平凡证明。具体流程涉及离线处理跟踪文件，标注步骤的依赖关系与用途，并划分为训练集与测试集，确保两者在猜想层面互斥。每个陈述均提供人类可读的打印版本及为机器学习优化的词元化表示，其中类型信息被擦除以简化处理，最终形成包含逾200万示例的平衡二分类数据集。

特点

HOLSTEP数据集的核心特点在于其专注于高阶逻辑定理证明，涵盖基础数学、分析与图论推理等多种形式化内容。数据集规模庞大，包含来自11400个证明的220余万步骤，其中正负样本均衡，为机器学习任务提供了稳定的实验基础。其陈述表示兼具人类可读性与机器可处理性，通过词元化方案减少括号使用，并采用德布鲁因索引处理变量，增强了逻辑结构的清晰度。此外，数据集设计支持多种机器学习任务，如步骤有用性预测、前提选择及中间陈述生成，为定理证明领域的算法研究提供了丰富且结构化的基准。

使用方法

HOLSTEP数据集的使用旨在推动机器学习在定理证明中的应用，主要任务包括条件与非条件的证明步骤分类。研究者可基于数据集训练模型，如逻辑回归、卷积神经网络或循环神经网络，以预测步骤在给定猜想背景下的有用性。使用前需预处理数据，可选择字符级或词元级编码输入模型，并通过共享权重的孪生网络分支处理步骤与猜想陈述。数据集的公开性与标准化格式便于复现实验，用户可借助提供的基准代码快速开展研究，评估模型在搜索空间剪枝、内部指导或中间步骤生成等实际证明场景中的效能。

背景与挑战

背景概述

在交互式定理证明领域，随着软件验证与数学形式化证明需求的日益增长，构建高效且智能的自动化推理系统成为核心研究议题。HOLSTEP数据集于2017年由因斯布鲁克大学与谷歌研究院的Cezary Kaliszyk、François Chollet及Christian Szegedy等学者共同创建，旨在为高阶逻辑定理证明提供机器学习研究基础。该数据集源自HOL Light证明库，涵盖多元分析、开普勒猜想等非平凡数学证明，包含逾两百万条训练样本，其核心目标在于探索机器学习在证明步骤分类、前提选择等任务中的应用潜力，以推动定理证明与人工智能的交叉融合，为自动化推理领域注入新的方法论活力。

当前挑战

HOLSTEP数据集致力于解决高阶逻辑定理证明中证明步骤生成与筛选的智能化挑战，其核心问题在于如何从海量中间逻辑步骤中识别有效推理路径，以提升证明搜索效率。在构建过程中，研究者面临多重技术难题：首先，需从HOL Light的原始证明轨迹中精确提取并标注有用与无用步骤，同时保持逻辑依赖关系的完整性；其次，高阶逻辑表达式的复杂结构与类型信息消除要求设计兼顾可读性与机器学习友好性的词元化方案；此外，数据集中证明步骤的语义深度与逻辑关联性对模型架构提出了超越表面模式匹配的推理能力要求，这构成了未来研究的关键突破方向。

常用场景

经典使用场景

在自动定理证明领域，HOLSTEP数据集为机器学习模型提供了丰富的训练与评估基础，其核心应用场景聚焦于证明步骤的分类任务。该数据集通过捕捉高阶逻辑证明中的中间步骤，使研究者能够训练模型区分在特定证明中有用与无用的逻辑陈述，从而模拟人类证明者的推理过程。这一场景不仅推动了定理证明自动化的发展，还为探索深度学习在形式化数学中的应用开辟了新路径。

衍生相关工作

HOLSTEP数据集催生了多项经典研究工作，特别是在机器学习与定理证明的交叉领域。基于该数据集，研究者开发了如DeepMath等序列模型，用于前提选择；同时，卷积神经网络与循环神经网络的基准模型被广泛探索，以优化证明步骤分类。这些工作进一步推动了神经符号推理的发展，并启发了后续数据集（如HOList）的构建，形成了定理证明中数据驱动方法的研究脉络。

数据集最近研究