RandCSPBench

Name: RandCSPBench
Creator: 博科尼大学·数据科学与分析研究所; 佛罗伦萨大学·物理与天文系; 罗马第一大学·物理系; 意大利国家研究委员会·纳米技术研究所; 哈瓦那大学·理论物理系
Published: 2026-02-21 02:41:48
License: 暂无描述

arXiv2026-02-21 更新2026-02-24 收录

下载链接：

https://github.com/ArtLabBocconi/RandCSPBench

下载链接

链接失效反馈

官方服务：

资源简介：

RandCSPBench是由博科尼大学等机构联合构建的约束满足问题基准数据集，包含3-SAT、4-SAT、3-col和5-col四类NP难问题实例，总计41.2万条数据。数据集通过调节子句变量比（α）和约束密度（c）等参数，系统生成不同难度级别的实例，覆盖从可满足性阈值附近到高硬度区间的完整谱系。其创新性在于引入统计物理相变理论指导的渐进式难度设计，并首次纳入K>3的高阶问题。该数据集旨在评估图神经网络与传统算法在组合优化问题中的性能边界，为算法鲁棒性研究提供标准化测试平台。

RandCSPBench is a benchmark dataset for constraint satisfaction problems jointly constructed by Bocconi University and other institutions. It includes four categories of NP-hard problem instances: 3-SAT, 4-SAT, 3-col, and 5-col, with a total of 412,000 data entries. The dataset systematically generates instances of varying difficulty levels by adjusting parameters such as the clause-to-variable ratio (α) and constraint density (c), covering the full spectrum from regions near the satisfiability threshold to the high-hardness regime. Its key innovation lies in adopting a progressive difficulty design guided by the statistical physics phase transition theory, and it is the first benchmark dataset to incorporate high-order constraint satisfaction problems with K>3. This dataset aims to evaluate the performance boundaries of graph neural networks and traditional algorithms on combinatorial optimization problems, providing a standardized testbed for research on algorithm robustness.

提供机构：

博科尼大学·数据科学与分析研究所; 佛罗伦萨大学·物理与天文系; 罗马第一大学·物理系; 意大利国家研究委员会·纳米技术研究所; 哈瓦那大学·理论物理系

创建时间：

2026-02-21

搜集汇总

数据集介绍

构建方式

在约束满足问题领域，RandCSPBench数据集通过统计物理学的视角构建，旨在为图神经网络与经典启发式算法提供严谨的基准测试。该数据集聚焦于K-SAT与q-coloring两类经典问题，通过随机生成实例并系统调整控制参数（如子句变量比α与平均连接度c）来覆盖从易到难的不同复杂度区域。实例生成遵循严格的随机采样流程，确保问题实例在满足性与难度上的多样性，同时包含训练集与测试集，并额外提供超出分布的大规模实例以评估算法的泛化能力。

特点

RandCSPBench数据集的核心特点在于其基于统计物理学相变理论的结构化难度梯度。通过精细调节α与c参数，数据集能够系统覆盖问题解空间的聚类、凝聚与可满足性阈值区域，从而实现对算法在不同硬度区域性能的细粒度评估。此外，数据集不仅包含传统上较易的3-SAT与3-coloring实例，还创新性地引入了更具挑战性的4-SAT与5-coloring问题，为评估算法在复杂场景下的鲁棒性提供了重要平台。数据集规模庞大，实例数量达到数万，且支持标准格式，确保了可重复性与广泛适用性。

使用方法

使用RandCSPBench数据集时，研究者可将其用于系统评估图神经网络与经典启发式算法在约束满足问题上的性能。数据集提供了明确的训练与测试划分，支持对算法在分布内及超出分布实例上的表现进行综合分析。评估时需注意算法运行时间应与问题规模线性缩放，以公平比较不同方法的效率。数据集兼容DIMACS CNF等标准格式，便于集成到现有求解流程中，同时其公开的代码库与生成工具支持自定义实例扩展与结果复现。

背景与挑战

背景概述

RandCSPBench数据集由Bocconi大学、罗马大学等机构的研究团队于2026年提出，旨在为约束满足问题的求解算法提供标准化基准测试。该数据集聚焦于随机K-SAT和q-coloring两类经典约束满足问题，通过统计物理中的相变理论构建具有不同难度层级的实例集合。其核心研究问题在于系统评估图神经网络与传统启发式算法在求解困难组合优化问题时的性能差异，填补了该领域缺乏统一基准的空白，对推动算法比较的科学严谨性具有重要影响。

当前挑战

RandCSPBench面临的挑战主要体现在两个方面：在领域问题层面，数据集需解决图神经网络在困难约束满足问题上性能评估标准缺失的难题，尤其针对K≥4和q≥5的高难度实例，现有神经网络方法普遍存在泛化能力不足与计算效率低下等问题；在构建过程中，需克服基于随机实例生成时参数选择与难度控制的复杂性，例如通过调整子句变量比α和平均度c来精确模拟相变区域，同时确保实例规模与分布满足训练与测试的平衡需求。

常用场景

经典使用场景

在约束满足问题的算法评估领域，RandCSPBench数据集被广泛用于系统比较图神经网络与传统启发式算法的性能。该数据集通过精心设计的随机K-SAT和q-coloring问题实例，提供了从简单到困难的连续复杂度谱系，使得研究者能够精确测试算法在不同相变区域的表现。其经典使用场景包括在受控环境下评估神经求解器的泛化能力，特别是在接近可满足性阈值的困难区域，算法性能的退化现象能够被清晰观测。

衍生相关工作

该数据集的发布催生了一系列关于图神经网络极限能力的深入研究。基于其揭示的性能差距，后续工作开始探索结合消息传递机制的混合架构，以及适应问题规模的计算时间缩放策略。在理论层面，数据集启发了对神经网络与相变几何结构相互作用的新分析框架。同时，其构建方法论被扩展至最大独立集等其他NP难问题，形成了基于统计物理的基准生成范式，推动了组合优化机器学习研究的标准化进程。

数据集最近研究