unigram/FOL-nli
收藏Hugging Face2024-06-21 更新2024-06-22 收录
下载链接:
https://hf-mirror.com/datasets/unigram/FOL-nli
下载链接
链接失效反馈官方服务:
资源简介:
数据集FOL-nli是一个用于逻辑推理和文本分类任务的数据集,使用一阶逻辑(FOL)进行推理。数据集包含训练、验证和测试三个分割,每个分割包含前提、假设、标签、前提TPTP、假设TPTP、证明输入、证明和规则集中度等特征。数据集的语言为英语,许可证为Apache-2.0。
数据集FOL-nli是一个用于逻辑推理和文本分类任务的数据集,使用一阶逻辑(FOL)进行推理。数据集包含训练、验证和测试三个分割,每个分割包含前提、假设、标签、前提TPTP、假设TPTP、证明输入、证明和规则集中度等特征。数据集的语言为英语,许可证为Apache-2.0。
提供机构:
unigram
原始信息汇总
数据集概述
数据集名称
- FOL-nli
数据集配置
- 默认配置
数据文件路径
- 训练集:
data/train-* - 验证集:
data/validation-* - 测试集:
data/test-*
数据集特征
premise: 字符串类型hypothesis: 字符串类型label: 字符串类型premise_tptp: 字符串类型hypothesis_tptp: 字符串类型proof_inputs: 字符串序列proof: 字符串类型rule_concentration: 浮点数类型
数据集分割
- 训练集: 82219个样本, 545983394.2802362字节
- 验证集: 10278个样本, 68252074.65929127字节
- 测试集: 10277个样本, 68245434.06047249字节
数据集大小
- 下载大小: 182483284字节
- 数据集大小: 682480903字节
许可
- Apache 2.0
任务类别
- 文本分类
语言
- 英语
标签
- 逻辑
- 推理
- 一阶逻辑
搜集汇总
数据集介绍

构建方式
在形式逻辑与自然语言推理的交叉领域,FOL-nli数据集通过创新的上下文敏感声明性语法构建而成。该方法系统地生成了大量一阶逻辑表达式及其对应的自然语言陈述,确保了前提与假设之间逻辑关系的多样性与复杂性。数据生成过程深度融合了形式化推理规则,为每个样本自动生成了可验证的证明序列,从而构建了一个规模庞大且逻辑自洽的语料库。
使用方法
研究者可将该数据集应用于自然语言推理、文本生成及问答等多个任务范畴。典型的使用流程包括加载标准化的训练、验证与测试分割,利用其自然语言字段进行NLI模型训练与评估,或同时利用其逻辑形式字段进行神经符号推理模型的联合训练。数据集中提供的证明序列可直接用于训练生成式模型输出推理步骤,或作为验证模型逻辑一致性的黄金标准。
背景与挑战
背景概述
在人工智能领域,逻辑推理能力的构建一直是自然语言处理与符号推理交叉研究的核心议题。FOL-nli数据集由Damien Sileo于2024年创建,其依托于一篇题为《Scaling Synthetic Logical Reasoning Datasets with Context-Sensitive Declarative Grammars》的学术论文。该数据集聚焦于一阶逻辑(First-Order Logic, FOL)在自然语言推理(Natural Language Inference, NLI)任务中的应用,旨在通过大规模合成数据,系统性地评估模型在复杂逻辑结构下的推理性能。其核心研究问题在于如何将形式化的逻辑表达式与自然语言表述相结合,从而推动机器在抽象推理、数学论证及哲学思辨等高层认知任务上的进展,对增强语言模型的逻辑一致性与可解释性具有显著影响力。
当前挑战
FOL-nli数据集致力于解决自然语言推理中逻辑一致性判定的挑战,特别是处理一阶逻辑所表达的复杂量化、谓词关系及嵌套结构,这要求模型不仅理解表面语义,还需进行深层的符号演算。在构建过程中,研究者面临如何通过上下文敏感的声明性语法高效生成大规模、多样化的逻辑前提与假设对,同时确保生成样本在逻辑上的严密性与语言上的自然流畅性。此外,将形式化的TPTP(Thousands of Problems for Theorem Provers)表示与自然语言对齐,并生成对应的证明序列,进一步增加了数据标注的复杂性与技术门槛。
常用场景
经典使用场景
在逻辑推理与自然语言处理交叉领域,FOL-nli数据集以其独特的一阶逻辑形式化标注,成为评估模型逻辑推理能力的经典基准。该数据集通过将自然语言前提与假设转化为一阶逻辑表达式,并附有证明过程,为研究者提供了结构化、可解释的推理任务。其典型应用场景包括训练和测试模型在复杂逻辑关系(如蕴含、矛盾、中立)上的分类性能,尤其在处理涉及量词、变量和谓词的逻辑语句时,数据集能够精准检验模型是否掌握形式逻辑的深层语义,而非仅依赖表面语言模式。
解决学术问题
该数据集有效应对了自然语言推理研究中逻辑一致性建模的挑战。传统NLI数据集常受限于语言偏见或浅层统计关联,而FOL-nli通过引入形式化逻辑标注,促使模型学习严格的演绎推理规则,而非记忆表面词汇共现。它解决了如何将自然语言语义映射到形式逻辑表示的核心问题,为探索符号推理与神经表示的结合提供了实验平台。其意义在于推动了可解释AI的发展,使模型推理过程更透明、可靠,并为评估模型在抽象逻辑任务上的泛化能力设立了新标准。
实际应用
在实际应用层面,FOL-nli数据集支撑了智能系统在需要严格逻辑验证的场景中的开发。例如,在法律文本分析中,模型可利用该数据集学习从法律条款中推导法律后果;在教育技术领域,它可用于构建自动逻辑推理辅导系统,帮助学生掌握形式论证技巧;在知识图谱与问答系统中,数据集能增强系统对复杂查询的逻辑处理能力,确保答案的严谨性。这些应用均依赖于模型对逻辑结构的深刻理解,而FOL-nli提供了必要的训练与评估资源。
数据集最近研究
最新研究方向
在逻辑推理与自然语言处理交叉领域,FOL-nli数据集凭借其融合一阶逻辑与自然语言推理的结构,正推动前沿研究向可解释性人工智能深化。该数据集通过提供形式化前提与假设的TPTP表示及证明过程,促进了神经符号推理模型的探索,使模型不仅能预测标签,还能生成逻辑证明链,增强推理的透明度和可靠性。当前热点集中于利用此类数据提升大语言模型在复杂逻辑任务中的泛化能力,减少对大规模标注数据的依赖,并推动数学定理证明、法律文本分析等领域的应用突破,为构建具备严谨推理能力的人工智能系统奠定基础。
以上内容由遇见数据集搜集并总结生成



