rule-reasoning

Hugging Face2025-06-11 更新2025-06-12 收录

下载链接：

https://huggingface.co/datasets/RuleReasoner/rule-reasoning

下载链接

链接失效反馈

官方服务：

资源简介：

Rule Reasoning Datasets包含用于基于规则推理任务的多个数据集，分为两个主要类别：In-Distribution数据集和Out-of-Distribution数据集。这些数据集用于训练和测试模型在规则推理方面的能力。

Rule Reasoning Datasets consist of multiple datasets targeting rule-based reasoning tasks, which are divided into two main categories: In-Distribution datasets and Out-of-Distribution datasets. These datasets are utilized to train and evaluate models' capabilities in rule-based reasoning.

创建时间：

2025-06-06

原始信息汇总

Rule Reasoning Datasets 数据集概述

基本信息

许可证: MIT
任务类别: 强化学习、文本分类
语言: 英语
标签: 基于规则的推理、逻辑推理
数据规模: 10K<n<100K

数据集分类

同分布 (In-Distribution, ID) 数据集

ar_lsat: 来自LSAT的分析推理
clutrr: 组合语言理解和基于文本的关系推理
folio: 自然语言中的一阶逻辑
logic_nli: 基于逻辑的自然语言推理
logical_deduction: 逻辑演绎任务
logiqa: 逻辑推理问答
prontoqa: 基于提示的问答
proofwriter: 证明生成和验证

异分布 (Out-of-Distribution, OOD) 数据集

bigbench_extra_hard: BigBench额外困难任务
bigbench_hard: BigBench困难任务
proverqa: 自动定理证明

文件格式

训练数据: train.json 或 train.parquet
测试数据: test.json 或 test.parquet
提供JSON和Parquet两种格式

使用方法

python from datasets import load_dataset

加载特定数据集

dataset = load_dataset("RuleReasoner/rule-reasoning", data_files="id/folio/train.json")

或加载特定数据集的所有文件

dataset = load_dataset("RuleReasoner/rule-reasoning", data_files="id/folio/*.json")

引用

latex @article{liu2025rulereasoner, title={RuleReasoner: Reinforced Rule-based Reasoning via Domain-aware Dynamic Sampling}, author={Yang Liu and Jiaqi Li and Zilong Zheng}, year={2025}, eprint={2506.08672}, archivePrefix={arXiv}, primaryClass={cs.CL}, url={https://arxiv.org/abs/2506.08672}, }

搜集汇总

数据集介绍

构建方式

在规则推理研究领域，该数据集通过系统整合多个权威子集构建而成，涵盖分析推理、一阶逻辑和自然语言推理等核心方向。数据源自标准化评测资源如LSAT考试题、人工标注的逻辑问题以及合成生成的定理证明任务，采用半自动化的流程进行清洗与标注，确保逻辑一致性和语言规范性。构建过程注重分布内与分布外数据的平衡，为模型泛化能力评估提供结构化基础。

使用方法

研究者可通过HuggingFace数据集库直接加载特定子集，支持按需选择JSON或Parquet格式进行灵活存取。典型应用场景包括训练规则感知的语言模型或评估逻辑推理系统的泛化性能。使用时应遵循原始论文的划分标准，注意分布内外数据的交叉验证，并可结合动态采样策略增强模型对规则体系的适应能力。

背景与挑战

背景概述

规则推理数据集由Yang Liu等人于2025年构建，旨在推动基于规则的逻辑推理研究。该数据集整合了多个经典推理任务，包括LSAT分析推理、一阶逻辑推理和自然语言逻辑推理等，涵盖了形式逻辑与自然语言处理的交叉领域。通过系统化组织分布内与分布外数据，该数据集为评估模型在结构化推理任务中的泛化能力提供了重要基准，对人工智能领域的可解释推理研究具有显著影响力。

当前挑战

该数据集核心挑战在于解决复杂规则系统的多跳推理问题，要求模型具备处理长逻辑链和隐含前提的能力。构建过程中面临数据异构性整合难题，需要统一不同来源的逻辑表示格式；同时需平衡分布内与分布外数据的覆盖范围，确保评估体系既能反映模型在已知规则下的表现，又能检验其对未知规则的泛化能力。数据标注过程中还需保证逻辑一致性和语义准确性，避免引入推理偏差。

常用场景

经典使用场景

在逻辑推理研究领域，rule-reasoning数据集为规则推理任务提供了标准化评估基准。该数据集通过整合LSAT分析推理、一阶逻辑推理和自然语言推理等任务，构建了涵盖分布内与分布外场景的完整测试体系。研究者通常利用其结构化数据训练模型进行逻辑规则提取和推理链验证，特别是在检验模型对复杂逻辑结构的理解能力时，该数据集能有效评估模型从前提推导结论的准确性。

解决学术问题

该数据集系统性地解决了人工智能领域规则推理的三大核心问题：一是模型对复合逻辑规则的组合泛化能力不足，二是传统方法在长链推理中的错误累积问题，三是对未知分布逻辑模式的适应性问题。通过提供多粒度标注的推理样本，它使研究者能够定量分析模型在符号推理与语义理解结合方面的缺陷，为构建具有严格逻辑保障的AI系统提供了关键数据支撑。

实际应用

在法律条文推理、医疗诊断辅助和金融风控系统等需要严格逻辑保障的领域，rule-reasoning数据集支撑着关键技术的落地应用。基于该数据集训练的模型能够解析复杂规则体系，在合同条款分析中自动识别逻辑矛盾，在临床决策支持中验证诊断路径的合理性，在信贷审批中确保决策过程符合监管规则。这些应用显著提升了专业领域决策的准确性和透明度。

数据集最近研究