MorishT/2024-07-08.JFLD.step-5
收藏Hugging Face2024-07-13 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/MorishT/2024-07-08.JFLD.step-5
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特征字段,如版本、假设、假设公式、事实、事实公式、证明、证明公式等。数据集还包含正反两方面的假设和证明,以及相关的标签和序列信息。数据集分为训练集和测试集,分别包含500个样本。
This dataset contains multiple feature fields such as version, hypothesis, hypothesis formula, facts, facts formula, proofs, proofs formula, etc. The dataset also includes both positive and negative hypotheses and proofs, along with related labels and serial information. The dataset is divided into training and test sets, each containing 500 samples.
提供机构:
MorishT
原始信息汇总
数据集概述
数据集信息
特征
- version: 字符串类型
- hypothesis: 字符串类型
- hypothesis_formula: 字符串类型
- facts: 字符串类型
- facts_formula: 字符串类型
- proofs: 字符串序列类型
- proofs_formula: 字符串序列类型
- negative_hypothesis: 字符串类型
- negative_hypothesis_formula: 字符串类型
- negative_proofs: 字符串序列类型
- negative_original_tree_depth: 64位整数类型
- original_tree_steps: 64位整数类型
- original_tree_depth: 64位整数类型
- steps: 64位整数类型
- depth: 64位整数类型
- num_formula_distractors: 64位整数类型
- num_translation_distractors: 64位整数类型
- num_all_distractors: 64位整数类型
- proof_label: 字符串类型
- negative_proof_label: 字符串类型
- world_assump_label: 字符串类型
- negative_world_assump_label: 字符串类型
- prompt_serial: 字符串类型
- proof_serial: 字符串类型
- prompt_serial_formula: 字符串类型
- proof_serial_formula: 字符串类型
数据分割
- train:
- 字节数: 2721315
- 样本数: 500
- test:
- 字节数: 2705603
- 样本数: 500
数据集大小
- 下载大小: 1875784 字节
- 数据集总大小: 5426918 字节
配置
- config_name: default
- data_files:
- train: data/train-*
- test: data/test-*
- data_files:
搜集汇总
数据集介绍

构建方式
在形式逻辑与自然语言推理领域,数据集的构建需兼顾严谨性与多样性。该数据集通过系统化流程生成,首先确立基础事实与假设,随后运用形式化逻辑规则推导出证明序列。构建过程中,不仅生成了正向的证明路径,还特意引入了负例假设及其对应的证明,以模拟推理中的反驳情境。此外,数据集还包含了多种干扰项,如公式干扰与翻译干扰,旨在增加推理任务的复杂性与真实性。整个生成过程依托于结构化的树状推导框架,确保了数据在逻辑深度与步骤上的可控性与层次性。
特点
本数据集的核心特征在于其双重逻辑结构的设计,同时涵盖正向与负向的推理轨迹。每个样本均包含自然语言表述与形式化公式的双重编码,实现了自然语言处理与符号逻辑的交叉验证。数据集中丰富的元数据,如证明步骤数、树深度及干扰项数量,为评估模型推理能力提供了多维度的量化指标。其规模适中,包含训练集与测试集各500条样本,适用于对推理模型进行精细化训练与评估,尤其在处理复杂逻辑关系与反事实推理方面展现出独特价值。
使用方法
使用该数据集时,研究者可将其应用于自然语言推理与自动定理证明等任务。数据集的结构支持端到端的模型训练,输入可为基础事实与假设,输出则为相应的证明序列或标签预测。通过利用数据集中的正负例对比,能够训练模型区分有效与无效推理。此外,形式化公式字段可用于探索神经符号结合的方法,提升模型在逻辑一致性上的表现。建议在预处理阶段注意对齐自然语言与公式表述,并利用步骤与深度元数据优化训练策略,以实现更精准的推理建模。
背景与挑战
背景概述
在形式逻辑与自然语言推理领域,构建能够精确评估模型逻辑推理能力的数据集至关重要。MorishT/2024-07-08.JFLD.step-5数据集由相关研究团队于2024年创建,专注于司法形式逻辑推理任务。该数据集的核心研究问题在于如何系统化地建模法律场景中的假设、事实与证明过程,并通过结构化公式与自然语言的双重表示,推动人工智能在法律逻辑分析与自动证明生成方面的发展。其设计深刻影响了司法人工智能与形式化推理交叉领域的研究,为评估模型的深度逻辑理解与步骤化推理能力提供了标准化基准。
当前挑战
该数据集旨在解决司法形式逻辑推理这一复杂领域问题,其核心挑战在于如何准确建模法律条文与案例中的多层次逻辑结构,并生成兼具严谨性与多样性的正负例证明序列。在构建过程中,研究人员需克服多重困难:一是确保自然语言描述与形式逻辑公式之间的语义一致性,避免转换失真;二是精心设计干扰项,以区分模型是否真正掌握逻辑规则而非表面模式;三是平衡证明步骤的深度与广度,以覆盖从简单推导到复杂推理的连续谱系,同时维持数据集的整体质量与可扩展性。
常用场景
经典使用场景
在形式逻辑与自动推理领域,该数据集通过结构化的事实、假设与证明序列,为逻辑推理模型的训练与评估提供了标准化基准。其经典使用场景聚焦于训练机器学习模型执行逻辑推导任务,特别是从给定事实出发,验证假设的真伪并生成形式化证明步骤。数据集中的正反例对与深度标注,使得模型能够学习区分有效与无效推理路径,从而提升在复杂逻辑环境下的泛化能力。
解决学术问题
该数据集有效应对了自动定理证明与逻辑推理中数据稀缺与标注困难的挑战,为研究社区提供了大规模、高质量的形式逻辑样本。它解决了传统方法在处理深层逻辑结构、多步推理以及反例构建方面的局限性,推动了神经符号推理、可解释人工智能等领域的发展。通过提供标准化的评估框架,该数据集促进了不同模型在逻辑一致性、推理深度与鲁棒性方面的公平比较,对提升AI系统的逻辑思维能力具有深远意义。
衍生相关工作
围绕该数据集,研究社区衍生出一系列经典工作,主要集中在神经定理证明器、逻辑推理增强的预训练语言模型以及可解释推理框架的开发。例如,部分研究利用该数据集的深度标注信息,探索了树状推理结构的神经网络建模;另一些工作则结合正反例对,设计了对抗性训练策略以提升模型的逻辑鲁棒性。这些衍生工作不仅深化了对形式逻辑与机器学习交叉领域的理解,也为构建更强大、更透明的推理系统奠定了理论基础。
以上内容由遇见数据集搜集并总结生成



