five

D-MIPLIB

收藏
Hugging Face2025-05-22 更新2025-05-23 收录
下载链接:
https://huggingface.co/datasets/weiminhu/D-MIPLIB
下载链接
链接失效反馈
官方服务:
资源简介:
分布式的MIPLIB(D-MIPLIB)是一个用于评估机器学习引导的混合整数线性规划(MILP)求解的第一个全面标准化数据集。它包含了多个领域的MILP实例,每个实例都以文本字符串的形式存储,并可以通过特定的许可证进行访问。

Distributed MIPLIB (D-MIPLIB) is the first comprehensive standardized dataset for evaluating machine learning-guided mixed integer linear programming (MILP) solvers. It contains MILP instances from multiple domains, each stored as a text string and accessible under specific licenses.
创建时间:
2025-05-14
原始信息汇总

数据集概述:Distributional MIPLIB (D-MIPLIB)

数据集简介

  • 首个用于评估机器学习引导的混合整数线性规划(MILP)求解的综合标准化数据集。
  • 包含13个应用领域的MILP分布,涵盖不同难度级别。

数据集组成

  • 每个分布包含一组相似的MILP优化问题实例,对应同一模型。
  • 每个分布通常包含1000个实例,部分领域例外:
    • Neural Network Verification:3692个实例
    • Maritime Inventory Routing Problem:118个实例
    • Seismic-Resilient Pipe Network Planning:
      • Easy分布:219个实例
      • Hard分布:206个实例

配置信息

数据集包含多个配置,按领域和难度划分:

CA (Covering Assignment)

  • CA-easy
  • CA-medium
  • CA-very-hard

SC (Set Covering)

  • SC-easy
  • SC-medium
  • SC-hard
  • SC-very-hard

MIS (Maximum Independent Set)

  • MIS-easy
  • MIS-medium
  • MIS-very-hard

MVC (Minimum Vertex Cover)

  • MVC-easy
  • MVC-medium
  • MVC-hard
  • MVC-very-hard

GISP (Generalized Independent Set Problem)

  • GISP-easy
  • GISP-medium
  • GISP-hard
  • GISP-very-hard
  • GISP-ext-hard

SRPN (Seismic-Resilient Pipe Network Planning)

  • SRPN-easy
  • SRPN-hard

CFLP (Capacitated Facility Location Problem)

  • CFLP-easy
  • CFLP-medium

MIRP (Maritime Inventory Routing Problem)

  • MIRP-medium

MMCN (Multi-Commodity Network Design)

  • MMCN-medium-BC
  • MMCN-medium-BI
  • MMCN-hard-BI
  • MMCN-very-hard-BI

NNV (Neural Network Verification)

  • NNV-easy

OTS (Optimal Transmission Switching)

  • OTS-easy
  • OTS-medium
  • OTS-hard

数据加载

  • MILP实例以文本字符串形式存储。
  • 提供Python代码示例,展示如何加载实例并保存为.lp或.mps文件。
  • 提供使用Gurobi求解MILP的代码示例。

许可证信息

各领域数据采用不同许可证:

领域 许可证
CA CC BY 4.0 License
SC CC BY 4.0 License
MIS CC BY 4.0 License
MVC CC BY 4.0 License
GISP CC BY 4.0 License
CFLP CC BY 4.0 License
LB BSD 3-Clause License
IP BSD 3-Clause License
MIRP BSD 3-Clause License
NNV CC BY 4.0 License
OTS CC BY 4.0 License
MMCN CC BY 4.0 License
SRPN CC BY 4.0 License

引用信息

BibTeX @misc{huang2024distributional, title={Distributional MIPLIB: a Multi-Domain Library for Advancing ML-Guided MILP Methods}, author={Weimin Huang and Taoan Huang and Aaron M Ferber and Bistra Dilkina}, year={2024}, eprint={2406.06954}, archivePrefix={arXiv}, primaryClass={cs.LG} }

搜集汇总
数据集介绍
main_image_url
构建方式
D-MIPLIB数据集作为首个面向混合整数线性规划(MILP)领域的标准化评估资源,其构建过程充分考虑了多领域覆盖与难度分层。该数据集整合了13个应用领域的MILP问题分布,每个领域包含从简单到极难不同难度层级的问题实例。数据来源既包含新生成的优化问题,也汇集了已有公开数据集中的经典案例,如神经网络验证领域包含3692个实例,海事库存路径规划领域则精选了118个典型场景。每个分布包含1000个同构问题实例,通过统一模型参数化生成,确保了数据分布的连贯性和可比性。
特点
该数据集最显著的特征在于其系统化的领域覆盖与精细化的难度划分。涵盖组合优化、资源分配、网络规划等多元应用场景,每个领域的问题实例均按照计算复杂度分为4-5个难度等级。数据存储采用标准化文本格式,支持.lp和.mps两种工业标准文件格式,便于与Gurobi等求解器直接兼容。特别值得注意的是,数据集保留了原始问题的数学建模特征,包括约束条件、目标函数等完整信息,为机器学习方法在MILP领域的迁移学习研究提供了理想基准。
使用方法
使用该数据集时,可通过HuggingFace的datasets库直接加载特定领域和难度层级的实例。加载后的MILP问题以字符串形式存储,经简单格式转换即可写入标准优化问题文件。用户可调用Gurobi等求解器进行问题求解,或提取特征用于机器学习模型训练。数据集采用模块化设计,支持按需加载单个测试实例或完整训练集,其分层的难度设置尤其适合算法鲁棒性测试。不同领域的数据遵循各自原始许可协议,使用时需注意遵守对应的CC BY 4.0或BSD 3-Clause等许可条款。
背景与挑战
背景概述
D-MIPLIB数据集由南加州大学研究团队于2024年推出,旨在为机器学习引导的混合整数线性规划(MILP)求解方法提供首个标准化评估基准。该数据集涵盖了13个应用领域的MILP问题分布,包括组合优化、网络规划、资源分配等多个方向,每个分布包含不同难度等级的实例集合。作为MIPLIB的扩展版本,D-MIPLIB通过系统化的难度分级和领域覆盖,填补了传统基准在评估机器学习方法泛化能力方面的空白,为运筹学与机器学习的交叉研究提供了重要基础设施。
当前挑战
该数据集面临的挑战主要体现在两个维度:在领域问题层面,MILP求解需要平衡计算效率与求解精度,尤其对于高难度实例,传统分支定界法的计算复杂度呈指数级增长;在构建过程中,研究团队需解决多源数据整合的难题,包括不同领域实例的格式标准化、难度等级的客观划分,以及保证各分布实例在保持领域特征的同时具备足够的多样性。此外,神经网络验证等特殊领域的实例稀缺性也增加了数据集的构建难度。
常用场景
经典使用场景
在混合整数线性规划(MILP)领域,D-MIPLIB数据集为研究者提供了一个标准化的评估平台,尤其适用于测试机器学习引导的求解器性能。该数据集涵盖了13个不同应用领域的MILP问题,包括组合优化、网络设计和资源分配等,每个领域的问题实例按照难度分级,便于研究者进行渐进式实验设计。通过提供多样化的实例集合,D-MIPLIB能够全面评估求解算法在不同场景下的泛化能力和鲁棒性。
实际应用
在实际应用中,D-MIPLIB的实例可直接用于供应链优化、网络资源分配和基础设施规划等场景。例如,其中的海事库存路径问题(MIRP)实例可用于设计高效的物流路线,而地震弹性管道网络规划(SRPN)实例则能辅助基础设施的抗震设计。数据集的结构化特性使其能够快速集成到工业级求解器中,为实际决策提供支持。
衍生相关工作
围绕D-MIPLIB,研究者已开展多项经典工作,包括基于图神经网络的求解器设计、强化学习在组合优化中的应用等。例如,谷歌DeepMind团队利用该数据集的神经网络验证(NNV)实例开发了新型MIP求解框架。此外,DS4DM竞赛平台也基于数据集中的实例组织了多届算法竞赛,推动了社区的技术迭代。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作