LogiOR、ComplexOR、NLP4LP、IndustryOR
收藏arXiv2025-08-20 更新2025-11-26 收录
下载链接:
https://hf-mirror.com/datasets/LabMem012/LogiOR
下载链接
链接失效反馈官方服务:
资源简介:
LogiOR数据集包含92个物流和供应链优化问题,涵盖线性规划、整数线性规划、混合整数线性规划和非线性规划等多种类型。ComplexOR数据集包含18个供应链、工业调度和物流领域的优化问题。NLP4LP数据集包含269个零售、能源和其他工业领域的优化问题。IndustryOR数据集包含100个来自教育、交通和金融等八个领域的真实世界优化问题。这些数据集都经过了系统性的错误纠正和更全面的注释,并提供了数学模型、可执行的求解器代码、最优解和问题特征等信息,为评估和训练优化建模框架提供了丰富的监督信号。
The LogiOR Dataset encompasses 92 logistics and supply chain optimization problems spanning linear programming (LP), integer linear programming (ILP), mixed-integer linear programming (MILP), and nonlinear programming (NLP). The ComplexOR Dataset includes 18 optimization problems across supply chain, industrial scheduling and logistics domains. The NLP4LP Dataset contains 269 optimization problems from retail, energy and other industrial sectors. The IndustryOR Dataset features 100 real-world optimization problems derived from eight fields including education, transportation and finance. All these datasets have undergone systematic error correction and more comprehensive annotations, and provide mathematical models, executable solver codes, optimal solutions, problem characteristics and other relevant information, serving as rich supervisory signals for the evaluation and training of optimization modeling frameworks.
提供机构:
浙江大学、新加坡-麻省理工学院研究与技术联盟(SMART)、Link.AI、Minimal Future Tech.(香港)
创建时间:
2025-08-20
搜集汇总
数据集介绍

构建方式
在运筹学领域,LogiOR数据集的构建遵循了严谨的学术规范,通过整合经典运筹学求解器测试数据集、教科书案例、研究论文及实际应用场景,形成了涵盖线性规划、整数线性规划、混合整数线性规划和非线性规划的92个物流与供应链优化问题。该数据集在三位运筹学专家的指导下历时两个月完成开发,每个问题均配备了标准化的数学公式、可执行的Gurobi代码、最优解及问题特征标注,确保了数据质量的可靠性与可复现性。
使用方法
该数据集适用于大语言模型在优化建模领域的性能评估与方法验证,研究者可通过标准化的接口访问数学公式与可执行代码,进行端到端的建模精度测试。在使用过程中,用户可依据问题类型与规模特征构建分层评估体系,结合ORThought等专业框架实现自然语言到数学模型的自动转换,同时利用数据集提供的完整标注信息开展错误模式分析与模型能力诊断,推动智能优化建模技术的迭代发展。
背景与挑战
背景概述
LogiOR数据集由浙江大学ZJU-UIUC联合学院的Beinuo Yang和Qishen Zhou等研究人员于2025年创建,旨在解决运筹学领域中优化建模自动化的核心研究问题。该数据集聚焦物流与供应链优化领域,包含92个涵盖线性规划、整数线性规划、混合整数线性规划和非线性规划的复杂问题实例。其创建基于经典运筹学求解器测试数据集、教科书案例和实际应用场景,经过三位运筹学专家历时两个月的精心构建与标准化标注。LogiOR的推出显著提升了优化建模基准数据集的质量标准,为基于大语言模型的自动化优化建模研究提供了重要的评估基础。
当前挑战
LogiOR数据集面临的挑战主要体现在两个层面:在领域问题层面,物流优化问题通常涉及复杂的约束条件、非线性成本函数和多目标权衡,传统优化建模方法需要深厚的领域专业知识;在构建过程中,数据集标注面临高达42%的错误率,需要系统性的错误校正机制。同时,复杂优化问题的数学表达形式多样,统一的标准化标注方案设计具有挑战性。此外,数据集需要平衡问题复杂度与可求解性,确保既能反映真实场景的复杂性,又能在合理计算资源下完成求解验证。
常用场景
经典使用场景
在运筹学与物流管理领域,LogiOR数据集作为标准化基准测试集,其经典应用场景聚焦于评估大语言模型在复杂优化问题建模中的性能。该数据集涵盖线性规划、整数线性规划、混合整数规划及非线性规划等典型问题类型,通过提供结构化数学建模标注与可执行代码,为自动化优化建模研究提供了系统化评估框架。
解决学术问题
LogiOR有效解决了优化建模领域三个核心学术问题:首先通过标准化标注体系降低了现有基准数据集中高达42%的标注错误率,其次构建了覆盖多类型优化问题的评估维度,最后通过引入专业领域知识提升了复杂约束条件的建模精度。该数据集为研究大语言模型在结构化推理任务中的能力边界提供了重要实验平台。
实际应用
在工业实践层面,LogiOR支撑的ORThought框架已成功应用于物流调度、供应链优化等实际场景。通过将自然语言描述的运营问题自动转化为数学规划模型,该系统显著降低了企业运用运筹学方法的技术门槛,在跨境物流路径优化、仓储资源分配等具体业务中实现了决策效率的量化提升。
数据集最近研究
最新研究方向
在运筹学与人工智能融合的前沿领域,LogiOR等数据集的推出标志着优化建模研究正迈向更高复杂度和实用性。当前研究聚焦于利用大语言模型的自然语言理解与推理能力,通过专家引导的思维链机制实现自动化建模流程,显著提升了混合整数规划和非线性规划等复杂问题的求解效率。这一方向与工业4.0背景下智能决策系统的迫切需求相呼应,特别是在物流供应链优化等典型场景中,通过标准化标注体系和多维度评估框架的建立,为构建可解释、可验证的优化模型提供了新范式。该进展不仅推动了运筹学方法的普惠化应用,更通过降低领域专家依赖度,为跨行业优化问题的规模化解决开辟了可行路径。
相关研究论文
- 1通过浙江大学、新加坡-麻省理工学院研究与技术联盟(SMART)、Link.AI、Minimal Future Tech.(香港) · 2025年
以上内容由遇见数据集搜集并总结生成



