Entailments for Propositional Logic

github2023-08-24 更新2024-05-31 收录

下载链接：

https://github.com/deepmind/logical-entailment-dataset

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集位于data目录下，每行包含一个六元组(A, B, E, H1, H2, H3)，其中A和B是命题，E是一个整数(1或0)，表示A是否蕴含B(记作A ⊧ B)，H1, H2, H3是简单启发式估计的统计数据。

The dataset is located in the data directory, with each line containing a sextuple (A, B, E, H1, H2, H3), where A and B are propositions, E is an integer (1 or 0) indicating whether A entails B (denoted as A ⊧ B), and H1, H2, H3 are statistics from simple heuristic estimates.

创建时间：

2018-02-16

原始信息汇总

数据集概述

数据集名称

Entailments for Propositional Logic

数据集内容

数据集位于data目录中，包含一系列逻辑命题的推论。

数据集结构

每条记录为一个六元组，格式如下：

A 和 B：命题
E：整数（1或0），表示A是否推论出B（记作A ⊧ B）
H1：长度比较（A的长度是否大于等于B的长度）
H2：变量包含关系（B的变量是否包含于A的变量）
H3：文字包含关系（B的否定正规形式是否包含于A的否定正规形式）

数据集生成

通过运行代码dist/build/entailment/entailment生成文件four_tuples.txt，其中包含所有推论。

命令行参数

第一个参数：生成的对数
第二个参数：公式中的最大变量数
第三个参数：公式的最大复杂度

数据集解析

提供了一个Python解析器，位于parser.py，用于解析此数据集。

搜集汇总

数据集介绍

构建方式

该数据集通过Haskell编程语言构建，使用cabal工具进行配置、构建和安装。生成过程涉及生成命题逻辑的蕴含关系对，并通过命令行参数控制生成的对数、公式中变量的最大数量以及公式的最大复杂度。生成的对经过筛选，提取出适合的四元组，最终生成包含蕴含关系的文本文件。

特点

该数据集以四元组形式存储，每行包含两个命题（A和B）、一个表示A是否蕴含B的整数E，以及三个启发式统计量（H1、H2、H3）。这些统计量分别衡量命题长度、变量包含关系和文字包含关系。数据集的核心在于命题对及其蕴含关系，为命题逻辑研究提供了丰富的实验数据。

使用方法

用户可通过运行Haskell代码生成数据集，生成的文件包含四元组信息。数据集还提供了Python解析器，便于在Python环境中加载和处理数据。命令行参数允许用户自定义生成的对数、变量数量和公式复杂度，以满足不同研究需求。生成的数据可直接用于命题逻辑的蕴含关系分析或机器学习模型的训练与评估。

背景与挑战

背景概述

Entailments for Propositional Logic 数据集由研究人员在ICLR会议上发布，旨在为命题逻辑中的蕴涵关系提供结构化数据支持。该数据集的核心研究问题聚焦于命题逻辑中的蕴涵判断，即给定两个命题A和B，判断A是否蕴涵B。这一问题的研究对于形式逻辑、自动推理以及自然语言处理等领域具有重要意义。数据集的构建基于Haskell代码生成，并通过Python解析工具提供了便捷的数据处理方式。其发布不仅推动了命题逻辑的形式化研究，还为相关领域的算法验证和模型训练提供了重要资源。

当前挑战

该数据集在构建过程中面临多重挑战。首先，命题逻辑蕴涵关系的复杂性要求生成算法能够高效处理不同复杂度的命题公式，同时确保生成的数据具有足够的多样性和代表性。其次，数据集的生成过程需要平衡公式的复杂性与生成效率，以避免生成过多无效或重复的命题对。此外，数据集的解析与使用依赖于特定的编程语言和工具链，这可能对部分研究人员的使用造成技术门槛。最后，如何将生成的蕴涵关系数据有效应用于实际推理任务，仍是一个亟待解决的领域问题。

常用场景

经典使用场景

在逻辑学和人工智能领域，命题逻辑的蕴含关系研究是基础且关键的。该数据集通过生成命题对及其蕴含关系，为研究者提供了一个标准化的测试平台，用于验证和比较不同的逻辑推理算法。特别是在自动定理证明和逻辑推理系统的开发中，该数据集能够帮助评估算法的准确性和效率。

解决学术问题

该数据集解决了命题逻辑中蕴含关系的自动化验证问题。通过提供大量的命题对及其蕴含结果，研究者可以系统地分析不同逻辑推理方法的性能。这不仅推动了逻辑推理算法的优化，还为逻辑学中的形式化验证提供了可靠的数据支持，促进了该领域的理论发展。

衍生相关工作

基于该数据集，许多经典的研究工作得以展开。例如，一些研究利用该数据集开发了高效的逻辑推理算法，并在国际会议上发表了相关论文。此外，该数据集还启发了更多关于逻辑推理和形式化验证的研究，推动了人工智能与逻辑学交叉领域的创新。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集