five

rediscovery-results

收藏
Hugging Face2025-03-29 更新2025-03-30 收录
下载链接:
https://huggingface.co/datasets/yalhessi/rediscovery-results
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个包含不同数学理论文件的集合,旨在用于数学公式和定理的自动发现。每个配置(afp、hol和octonions)都包含了理论文件的相关信息,如词形名称、命令、对象、模板、符号和定义等。数据集还包含了关于重新发现任务的成功与否的信息,以及是否使用符号或神经方法进行重新发现。数据集分为训练集和测试集,以便进行模型的训练和评估。
创建时间:
2025-03-27
搜集汇总
数据集介绍
main_image_url
构建方式
在形式化数学与自动定理证明领域,rediscovery-results数据集通过系统化采集不同数学理论框架下的引理及其证明过程构建而成。数据集涵盖AFP、HOL和Octonions三个子集,每个子集均包含理论文件、引理名称、命令序列、符号定义等结构化字段,通过精确记录符号推理和神经推理的重新发现结果,为研究数学知识的自动化重构提供了实验基础。数据构建过程严格遵循形式化验证规范,确保每个引理对象的逻辑完整性和可复现性。
特点
该数据集最显著的特点在于其多模态的数学知识表示方式,既包含符号逻辑的精确编码(如lemma_command和symbols字段),又融合了神经网络的预测结果(task3_predictions字段)。三个子集分别对应不同复杂度的数学理论体系,其中AFP子集专注高阶逻辑定理,HOL子集体现交互式证明环境特性,Octonions子集则针对特定代数结构。数据集通过symbolic_rediscover和neural_rediscover等布尔标签,清晰标注了传统符号方法与现代神经网络在定理重新发现任务中的表现差异。
使用方法
研究者可通过加载特定子集(如hol或octonions)的train/test分割展开实验,利用theory_file和lemma_object字段重建形式化证明环境。对于符号推理研究,可重点分析defs和symbols字段的逻辑结构;而机器学习方向则可通过task3_predictions与rediscovery_success的关联性设计评估指标。数据集默认加载Octonions配置,用户需根据研究目标选择是否启用AFP或HOL子集,各子集的split设计支持标准的机器学习工作流。
背景与挑战
背景概述
rediscovery-results数据集聚焦于自动定理证明与符号推理领域,旨在评估机器学习模型在数学定理重新发现任务中的性能。该数据集由多个配置组成,包括afp、hol和octonions,涵盖了不同数学理论背景下的定理证明场景。数据集的核心研究问题在于探索神经网络与符号系统在复杂数学推理任务中的协同能力,为形式化数学与人工智能的交叉研究提供了重要基准。其构建反映了近年来形式化方法社区对可解释AI与机器辅助证明日益增长的研究兴趣。
当前挑战
该数据集面临的主要挑战体现在两个维度:在领域问题层面,数学定理的重新发现要求模型同时具备符号操作能力与高级抽象推理能力,这对现有机器学习范式提出了严峻考验。构建过程中,研究人员需要解决形式化数学语言的标准表示问题,确保不同证明系统间的兼容性。数据集中的exact_match和rediscovery_success等评价指标的设计,反映了准确衡量机器推理能力与人类数学家思维差异的固有难度。多配置结构虽然增强了数据集的适用广度,但也带来了跨领域评估的一致性问题。
常用场景
经典使用场景
在自动定理证明领域,rediscovery-results数据集被广泛应用于评估符号推理和神经推理模型在数学引理重发现任务中的性能。该数据集通过记录理论文件、引理命令和符号定义等结构化信息,为研究者提供了验证自动化推理系统能否重新发现已知数学定理的标准化测试平台。其多模态配置(AFP、HOL、Octonions)覆盖了从抽象代数到高阶逻辑的不同数学分支,使得跨领域的推理能力比较成为可能。
解决学术问题
该数据集有效解决了形式化数学中自动化推理的可复现性评估难题。通过精确标注符号化重发现(symbolic_rediscover)与神经重发现(neural_rediscover)的成功标志,量化了不同方法在数学结构重建方面的能力差异。其引入的exact_match指标为衡量定理形式化表达的精确匹配提供了新标准,推动了自动推理领域从粗粒度评估向细粒度验证的范式转变。
衍生相关工作
基于该数据集衍生的经典工作包括神经符号集成推理框架的对比研究,其中Holophrasm等系统利用其训练数据实现了高阶逻辑的神经语法生成。在符号AI领域,TacticToe等项目通过分析数据集中的theory_file结构,开发出基于模板的定理证明策略。近期工作更将rediscovery-success指标扩展为评估数学知识表示学习的新基准。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作