five

RandCSPBench

收藏
arXiv2026-02-21 更新2026-02-24 收录
下载链接:
https://github.com/ArtLabBocconi/RandCSPBench
下载链接
链接失效反馈
官方服务:
资源简介:
RandCSPBench是由博科尼大学等机构联合构建的约束满足问题基准数据集,包含3-SAT、4-SAT、3-col和5-col四类NP难问题实例,总计41.2万条数据。数据集通过调节子句变量比(α)和约束密度(c)等参数,系统生成不同难度级别的实例,覆盖从可满足性阈值附近到高硬度区间的完整谱系。其创新性在于引入统计物理相变理论指导的渐进式难度设计,并首次纳入K>3的高阶问题。该数据集旨在评估图神经网络与传统算法在组合优化问题中的性能边界,为算法鲁棒性研究提供标准化测试平台。

RandCSPBench is a benchmark dataset for constraint satisfaction problems jointly constructed by Bocconi University and other institutions. It includes four categories of NP-hard problem instances: 3-SAT, 4-SAT, 3-col, and 5-col, with a total of 412,000 data entries. The dataset systematically generates instances of varying difficulty levels by adjusting parameters such as the clause-to-variable ratio (α) and constraint density (c), covering the full spectrum from regions near the satisfiability threshold to the high-hardness regime. Its key innovation lies in adopting a progressive difficulty design guided by the statistical physics phase transition theory, and it is the first benchmark dataset to incorporate high-order constraint satisfaction problems with K>3. This dataset aims to evaluate the performance boundaries of graph neural networks and traditional algorithms on combinatorial optimization problems, providing a standardized testbed for research on algorithm robustness.
提供机构:
博科尼大学·数据科学与分析研究所; 佛罗伦萨大学·物理与天文系; 罗马第一大学·物理系; 意大利国家研究委员会·纳米技术研究所; 哈瓦那大学·理论物理系
创建时间:
2026-02-21
搜集汇总
数据集介绍
构建方式
在约束满足问题领域,RandCSPBench数据集通过统计物理学的视角构建,旨在为图神经网络与经典启发式算法提供严谨的基准测试。该数据集聚焦于K-SAT与q-coloring两类经典问题,通过随机生成实例并系统调整控制参数(如子句变量比α与平均连接度c)来覆盖从易到难的不同复杂度区域。实例生成遵循严格的随机采样流程,确保问题实例在满足性与难度上的多样性,同时包含训练集与测试集,并额外提供超出分布的大规模实例以评估算法的泛化能力。
特点
RandCSPBench数据集的核心特点在于其基于统计物理学相变理论的结构化难度梯度。通过精细调节α与c参数,数据集能够系统覆盖问题解空间的聚类、凝聚与可满足性阈值区域,从而实现对算法在不同硬度区域性能的细粒度评估。此外,数据集不仅包含传统上较易的3-SAT与3-coloring实例,还创新性地引入了更具挑战性的4-SAT与5-coloring问题,为评估算法在复杂场景下的鲁棒性提供了重要平台。数据集规模庞大,实例数量达到数万,且支持标准格式,确保了可重复性与广泛适用性。
使用方法
使用RandCSPBench数据集时,研究者可将其用于系统评估图神经网络与经典启发式算法在约束满足问题上的性能。数据集提供了明确的训练与测试划分,支持对算法在分布内及超出分布实例上的表现进行综合分析。评估时需注意算法运行时间应与问题规模线性缩放,以公平比较不同方法的效率。数据集兼容DIMACS CNF等标准格式,便于集成到现有求解流程中,同时其公开的代码库与生成工具支持自定义实例扩展与结果复现。
背景与挑战
背景概述
RandCSPBench数据集由Bocconi大学、罗马大学等机构的研究团队于2026年提出,旨在为约束满足问题的求解算法提供标准化基准测试。该数据集聚焦于随机K-SAT和q-coloring两类经典约束满足问题,通过统计物理中的相变理论构建具有不同难度层级的实例集合。其核心研究问题在于系统评估图神经网络与传统启发式算法在求解困难组合优化问题时的性能差异,填补了该领域缺乏统一基准的空白,对推动算法比较的科学严谨性具有重要影响。
当前挑战
RandCSPBench面临的挑战主要体现在两个方面:在领域问题层面,数据集需解决图神经网络在困难约束满足问题上性能评估标准缺失的难题,尤其针对K≥4和q≥5的高难度实例,现有神经网络方法普遍存在泛化能力不足与计算效率低下等问题;在构建过程中,需克服基于随机实例生成时参数选择与难度控制的复杂性,例如通过调整子句变量比α和平均度c来精确模拟相变区域,同时确保实例规模与分布满足训练与测试的平衡需求。
常用场景
经典使用场景
在约束满足问题的算法评估领域,RandCSPBench数据集被广泛用于系统比较图神经网络与传统启发式算法的性能。该数据集通过精心设计的随机K-SAT和q-coloring问题实例,提供了从简单到困难的连续复杂度谱系,使得研究者能够精确测试算法在不同相变区域的表现。其经典使用场景包括在受控环境下评估神经求解器的泛化能力,特别是在接近可满足性阈值的困难区域,算法性能的退化现象能够被清晰观测。
衍生相关工作
该数据集的发布催生了一系列关于图神经网络极限能力的深入研究。基于其揭示的性能差距,后续工作开始探索结合消息传递机制的混合架构,以及适应问题规模的计算时间缩放策略。在理论层面,数据集启发了对神经网络与相变几何结构相互作用的新分析框架。同时,其构建方法论被扩展至最大独立集等其他NP难问题,形成了基于统计物理的基准生成范式,推动了组合优化机器学习研究的标准化进程。
数据集最近研究
最新研究方向
在约束满足问题领域,RandCSPBench数据集的引入标志着对图神经网络性能评估的标准化迈出了关键一步。该数据集基于随机K-SAT和q-coloring问题构建,通过统计物理中的相变理论系统化地控制实例难度,涵盖了从简单到复杂的多种问题变体。前沿研究聚焦于探索图神经网络在解决硬优化问题时的根本局限性,特别是在面对一步副本对称破缺理论所描述的困难实例时,其性能相较于经典启发式算法如聚焦Metropolis搜索和模拟退火存在显著差距。当前热点在于分析神经求解器的算法阈值与问题规模之间的缩放关系,揭示其在分布外泛化能力上的不足,以及如何通过调整推理时间与问题规模的线性缩放来提升性能。这一研究不仅推动了神经网络在组合优化领域的理论发展,也为设计更鲁棒的求解器提供了实证基础,对人工智能与计算科学的交叉融合具有深远意义。
相关研究论文
  • 1
    Benchmarking Graph Neural Networks in Solving Hard Constraint Satisfaction Problems博科尼大学·数据科学与分析研究所; 佛罗伦萨大学·物理与天文系; 罗马第一大学·物理系; 意大利国家研究委员会·纳米技术研究所; 哈瓦那大学·理论物理系 · 2026年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作