five

StructureSAT

收藏
arXiv2025-02-17 更新2025-02-27 收录
下载链接:
https://drive.google.com/drive/folders/1ZrhRlRqQUTrYExVzVbXaocjvNIi2Os25
下载链接
链接失效反馈
官方服务:
资源简介:
StructureSAT是一个大规模的饱和问题(SAT)数据集,由新南威尔士大学计算机科学与工程学院创建。该数据集包含来自不同问题领域的多样化SAT问题,旨在研究图神经网络(GNN)在SAT问题上的泛化能力。数据集涵盖了随机、设计、伪工业和工业等11个SAT领域,并研究了9种对传统SAT求解器有影响的图形结构属性。数据集通过结构属性对问题领域进行细分,以研究不同结构属性对GNN求解器泛化能力的影响。

StructureSAT is a large-scale Satisfiability Problem (SAT) dataset developed by the School of Computer Science and Engineering at the University of New South Wales. This dataset includes diverse SAT problems from various problem domains, with the aim of researching the generalization capability of Graph Neural Networks (GNNs) on SAT problems. The dataset covers 11 SAT domains such as random, crafted, pseudo-industrial and industrial ones, and involves 9 graph structural attributes that affect traditional SAT solvers. The dataset subdivides problem domains based on structural attributes to study the impact of different structural attributes on the generalization ability of GNN-based solvers.
提供机构:
新南威尔士大学计算机科学与工程学院
创建时间:
2025-02-17
搜集汇总
数据集介绍
main_image_url
构建方式
StructureSAT数据集的构建基于对现有SAT问题域的深入分析,旨在探究图神经网络(GNN)在解决SAT问题时的泛化能力。数据集涵盖了11个SAT域,分为随机、设计、伪工业和工业四个高级类别,并对每个域内的SAT问题进行了9种结构属性的测量,包括基于CNF和基于图的结构属性。数据集的生成使用了多种现有的SAT生成器和数据集,如CNFgen、SR(n)、SATCOMP、G2SAT等,以确保数据集的多样性和代表性。在生成原始数据集后,数据集被根据特定的结构值进行分割,以形成多个训练、验证和测试子集,以便于分析不同结构属性对GNN泛化能力的影响。
特点
StructureSAT数据集的特点在于其结构的多样性和对结构属性的深入分析。数据集不仅包含了不同类型的SAT问题,还测量了每个问题的多个结构属性,如模块度、自相似性、树宽、中心性、社区结构等。此外,数据集采用了新颖的分割方法,将每个问题域根据其结构属性的平均值分割为高值和低值子集,从而可以更细致地研究GNN在不同结构特征下的泛化能力。数据集还包含了由DRAT-trim证明生成的学习子句,以研究学习子句对GNN泛化能力的影响。
使用方法
使用StructureSAT数据集的方法包括以下步骤:首先,选择一个或多个结构属性作为分析对象。其次,根据这些属性的平均值将数据集分割为高值和低值子集。然后,在每个子集上训练一个或多个GNN模型,并使用不同的测试集评估模型的泛化能力。测试集可以是从同一域中随机生成的较大问题、具有不同结构属性的同一域问题,或者来自不同域的问题。最后,通过比较不同结构和模型在泛化任务上的表现,分析结构属性对GNN泛化能力的影响。
背景与挑战
背景概述
StructureSAT数据集的研究背景源于对图神经网络(GNN)在解决可满足性(SAT)问题中的泛化能力的探索。GNN基求解器在利用已解决问题的知识来解决新的SAT问题时展现出潜力,但其在解决SAT问题的结构特性与泛化能力之间的关系上存在研究空白。StructureSAT数据集由澳大利亚新南威尔士大学计算机科学与工程学院的研究团队创建,旨在通过分析SAT问题的图结构特性来解释GNN基求解器的泛化问题。该数据集包含来自多个已知问题领域的多样化SAT问题,并采用了一种新颖的分割方法,根据问题的结构特性将其分解成更详细的层次结构。StructureSAT数据集的出现填补了GNN基SAT求解器研究中的空白,并为开发更有效、更具泛化能力的SAT求解器提供了新的方向。
当前挑战
StructureSAT数据集面临的主要挑战包括:1) 所解决的领域问题,即探索GNN基SAT求解器在处理具有不同结构特性的SAT问题时的泛化能力;2) 构建过程中所遇到的挑战,例如,如何有效地生成具有多样化结构特性的SAT问题,以及如何确保数据集的多样性和平衡性。此外,数据集的构建还涉及到如何利用图结构特性来指导GNN的训练和测试,以及如何评估GNN在不同结构特性下的泛化性能。
常用场景
经典使用场景
StructureSAT 数据集被设计用于分析图神经网络 (GNN) 在解决 SAT 问题时的泛化能力。该数据集包含了从已知问题领域中收集的各种 SAT 问题,并利用新颖的分割方法,基于问题的结构属性将其分解为更详细的层次结构。StructureSAT 的经典使用场景是作为 GNN 基于的 SAT 求解器的训练和测试数据集,以评估和改进 GNN 在不同结构属性下的泛化性能。
解决学术问题
StructureSAT 数据集解决了现有 GNN 基于的 SAT 求解器在泛化能力方面的挑战。通过研究 SAT 问题的结构图属性(如模块化、自相似性)与 GNN 泛化能力之间的关系,StructureSAT 帮助研究人员识别并解释 GNN 求解器在泛化方面的不足,从而为开发更有效和泛化的 SAT 求解器提供了新的研究方向。
衍生相关工作
StructureSAT 数据集的发布衍生出了一系列相关的研究工作,主要集中在如何利用结构属性来改进 GNN 基于的 SAT 求解器的泛化能力。这些工作包括但不限于:1) 对 StructureSAT 数据集的结构属性进行深入分析,以揭示不同结构属性对 GNN 泛化能力的影响;2) 开发新的 GNN 模型和方法,以更好地捕捉和利用 SAT 问题的结构信息;3) 探索如何将 StructureSAT 数据集应用于其他 NP-hard 问题,以提高 GNN 的泛化能力。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作