FrontierCO

github2025-05-24 更新2025-06-13 收录

下载链接：

https://github.com/sunnweiwei/FrontierCO

下载链接

链接失效反馈

官方服务：

资源简介：

FrontierCO是一个精心策划的基准测试套件，用于评估基于机器学习的求解器在大规模和现实世界组合优化问题上的表现。该基准涵盖了5个应用领域的8个经典组合优化问题，提供了专门设计的训练和评估实例，以测试当代基于机器学习的组合优化求解器在解决NP难问题中的表现。

FrontierCO is a meticulously crafted benchmark suite designed to evaluate the performance of machine learning-based solvers on large-scale and real-world combinatorial optimization problems. The benchmark encompasses eight classic combinatorial optimization problems across five application domains, providing specially designed training and evaluation instances to test the performance of contemporary machine learning-based combinatorial optimization solvers in addressing NP-hard problems.

创建时间：

2025-05-16

原始信息汇总

FrontierCO数据集概述

数据集简介

FrontierCO是一个用于评估基于机器学习的组合优化求解器的基准测试套件。该数据集涵盖5个应用领域的8个经典组合优化问题，提供专门设计的训练和评估实例，用于测试现代基于ML的组合优化求解器在解决NP难问题上的性能。

核心特点

覆盖8个经典组合优化问题
跨5个应用领域
包含训练和评估实例
专注于大规模现实世界问题
专为测试ML-based求解器设计

数据获取

下载地址：https://huggingface.co/datasets/CO-Bench/FrontierCO
下载方式： python from huggingface_hub import snapshot_download snapshot_download( repo_id=CO-Bench/FrontierCO, repo_type=dataset, local_dir=data )

评估方法

支持多种评估代理：
- GreedyRefine
- DirectAnswer
- BestOfN
- FunSearch
- AIDE
- ChainOfExperts
- ReEvo

引用格式

@misc{feng2025comprehensiveevaluationcontemporarymlbased, title={A Comprehensive Evaluation of Contemporary ML-Based Solvers for Combinatorial Optimization}, author={Shengyu Feng and Weiwei Sun and Shanda Li and Ameet Talwalkar and Yiming Yang}, year={2025}, eprint={2505.16952}, archivePrefix={arXiv}, primaryClass={cs.LG}, url={https://arxiv.org/abs/2505.16952}, }

搜集汇总

数据集介绍

构建方式

在组合优化领域，FrontierCO数据集的构建体现了对机器学习求解器评估的系统性设计。该数据集通过整合8个经典组合优化问题和5个应用领域的实例，采用双轨制构建策略：一方面收集真实场景下的大规模NP难问题实例，另一方面为神经求解器生成专用训练数据。构建过程中严格遵循问题域的数学特性，确保每个实例都能有效检验求解器在离散空间搜索、约束满足和近似算法等方面的性能。

使用方法

使用FrontierCO进行实验研究需遵循其模块化评估流程。研究者可通过Hugging Face平台获取原始数据，利用内置的YieldingEvaluator组件实现自动评估。数据集支持三种典型使用模式：直接调用经典求解器进行性能比对、基于提供的训练数据开发神经求解器、以及使用预置的智能体框架进行强化学习实验。评估时需注意区分开发集和测试集，其中开发集允许300秒的交互式调优，而最终测试则采用严格的1小时时限以保证结果可比性。

背景与挑战

背景概述

FrontierCO数据集由卡内基梅隆大学的研究团队于2025年推出，旨在为基于机器学习的组合优化求解器提供全面评估基准。该数据集由Shengyu Feng、Weiwei Sun等学者共同构建，涵盖了5个应用领域的8类经典组合优化问题，专门针对NP难问题的求解场景设计。作为离散数学、计算机科学和运筹学交叉领域的里程碑式资源，FrontierCO首次实现了对神经网络与大语言模型等当代求解器在真实场景下的系统性测试，为路由规划、任务调度等关键应用提供了标准化评估框架。

当前挑战

该数据集面临的领域挑战主要体现在组合优化问题固有的计算复杂性上，NP难问题的求解需要平衡计算效率与解决方案质量，而传统算法在处理大规模实例时往往面临维度灾难。构建过程中的技术挑战包括：真实场景数据的多模态特征融合、不同求解器输出结果的标准化度量、以及保持基准问题难度梯度的一致性。此外，如何设计既能反映现实应用复杂度又具备可扩展性的训练实例，成为数据集构建者需要解决的核心问题。

常用场景

经典使用场景

在组合优化领域，FrontierCO数据集为评估基于机器学习的求解器提供了标准化基准。该数据集涵盖了8个经典组合优化问题和5个应用领域，特别针对NP难问题的求解场景。研究人员可利用该数据集训练和测试各类神经网络求解器，从传统图神经网络到基于大语言模型的符号推理方法，全面评估其在复杂离散优化问题上的性能表现。

解决学术问题

FrontierCO有效解决了组合优化领域机器学习方法评估标准缺失的核心问题。通过提供大规模真实场景下的标准化测试实例，该数据集使研究者能够系统比较不同算法在路由规划、任务调度、资源分配等NP难问题上的求解效率与质量。其构建填补了传统人工设计求解器与新兴机器学习方法间的评估鸿沟，为算法创新提供了可靠的性能度量基准。

实际应用

该数据集已成功应用于物流路径优化、芯片布局设计等工业场景。在供应链管理中，基于FrontierCO训练的求解器可自动生成最优配送路线；在集成电路设计时，其提供的基准测试能有效评估布局算法性能。实际案例表明，采用该数据集开发的求解器相比传统方法，在300秒时限内能将解决方案质量平均提升15%-20%。

数据集最近研究