G4SATBench

Name: G4SATBench
Creator: 多伦多大学
Published: 2024-05-11 05:45:26
License: 暂无描述

arXiv2024-05-11 更新2024-06-21 收录

下载链接：

https://github.com/zhaoyu-li/G4SATBench

下载链接

链接失效反馈

官方服务：

资源简介：

G4SATBench是由多伦多大学和上海交通大学的研究团队创建的综合性SAT解决数据集，包含7个不同来源和难度的数据集。该数据集旨在为基于图神经网络的SAT解决方法提供一个公平的评估框架。数据集涵盖了从随机问题到组合问题的广泛范围，每个数据集都有三个难度级别：简单、中等和困难。G4SATBench不仅包括了先前的数据集，还引入了新的难度级别，以支持更细致的分析。数据集的创建过程经过精心设计，以避免生成平凡的案例，并确保数据集的质量和多样性。该数据集的应用领域包括机器学习和人工智能，特别是在解决布尔可满足性问题（SAT）方面，旨在提高解决策略的效率和准确性。

G4SATBench is a comprehensive SAT solving dataset developed by research teams from the University of Toronto and Shanghai Jiao Tong University, which includes 7 datasets with distinct sources and difficulty characteristics. This dataset is designed to offer a fair evaluation framework for graph neural network-based SAT solving approaches. It covers a broad spectrum of problem types spanning from random instances to combinatorial problems, with each dataset containing three difficulty levels: easy, medium, and hard. Beyond incorporating existing prior datasets, G4SATBench introduces new difficulty tiers to support more fine-grained analysis. The dataset was carefully constructed during its development to avoid trivial cases and guarantee its quality and diversity. Its application areas cover machine learning and artificial intelligence, specifically for Boolean Satisfiability Problem (SAT) solving, with the objective of enhancing the efficiency and accuracy of SAT solving strategies.

提供机构：

多伦多大学

创建时间：

2023-09-29

搜集汇总

数据集介绍

构建方式

G4SATBench 数据集通过精心策划，构建了一个大规模且多样化的 SAT 数据集集合，涵盖了 7 个不同的问题，并设置了 3 个难度级别。具体而言，该数据集包括来自随机实例、伪工业实例和组合问题的数据，不仅涵盖了广泛的现有数据集，还为每个数据集引入了 3 个难度级别，以便进行细粒度的分析。此外，数据集的生成参数经过精心选择，避免了生成过于简单或过于复杂的实例，确保了数据集的质量和多样性。

使用方法

G4SATBench 数据集可以用于训练和评估基于图神经网络（GNN）的 SAT 求解器。用户可以选择不同的 GNN 模型，如 NeuroSAT、GCN、GGNN 和 GIN，并在数据集上进行训练和测试。数据集支持多种预测任务，包括可满足性预测、满足赋值预测和不可满足核心变量预测。通过使用不同的训练目标和推理算法，用户可以深入探索 GNN 在 SAT 求解中的潜力，并评估其在不同任务和数据分布上的表现。

背景与挑战

背景概述

G4SATBench是由多伦多大学和上海交通大学的研究人员于2024年发布的，旨在解决布尔可满足性问题（SAT）的图神经网络（GNN）基准数据集。该数据集的创建是为了填补现有文献中缺乏统一数据集和公平基准的空白，特别是在GNN应用于SAT求解领域。G4SATBench包含了来自不同来源和难度级别的7个数据集，涵盖了随机实例、伪工业实例和组合问题，并引入了3个难度级别，以进行细粒度的分析。该数据集的发布为GNN在SAT求解中的性能评估提供了全面的框架，并为未来的研究奠定了基础。

当前挑战

G4SATBench面临的主要挑战包括：1) 构建一个多样化和高质量的SAT数据集，涵盖不同领域和难度级别，以确保GNN模型能够进行广泛的训练和评估；2) 在构建过程中，研究人员需要克服数据集的多样性和复杂性，确保每个数据集的实例都具有代表性，并且能够有效评估GNN模型的性能；3) GNN模型在SAT求解中的表现仍然存在局限性，尤其是在学习回溯搜索（如CDCL）策略时，GNN模型难以有效捕捉其复杂性，导致在处理复杂实例时表现不佳。此外，GNN模型在处理大规模实际问题时也面临挑战，因为现有的数据集规模较小，无法完全模拟实际应用中的复杂性。

常用场景

经典使用场景

G4SATBench 数据集的经典使用场景在于评估和比较基于图神经网络（GNN）的布尔可满足性问题（SAT）求解器。该数据集通过提供多样化的 SAT 实例和不同难度的数据集，支持多种预测任务、训练目标和推理算法，使得研究者能够全面评估 GNN 在 SAT 求解中的表现。

解决学术问题

G4SATBench 数据集解决了当前学术界在 GNN 求解 SAT 问题中缺乏统一基准的难题。通过提供一个全面的评估框架，该数据集使得不同方法能够在公平的环境下进行比较，从而推动了 GNN 在 SAT 求解领域的研究进展。此外，G4SATBench 还揭示了现有 GNN 模型在贪婪局部搜索策略上的有效性，但在回溯搜索策略上的局限性，为未来的研究提供了重要的方向。

实际应用

G4SATBench 数据集在实际应用中具有广泛的前景，尤其是在需要高效求解大规模 SAT 实例的场景中。例如，在电路设计、自动定理证明、组合优化等领域，SAT 求解器的高效性至关重要。G4SATBench 通过提供多样化的数据集和基准测试，帮助开发更高效的 SAT 求解器，从而提升这些领域的实际应用效果。

数据集最近研究