OptMATH-Train和OptMATH-Bench

github2025-05-06 更新2025-05-08 收录

下载链接：

https://github.com/optsuite/OptMATH

下载链接

链接失效反馈

官方服务：

资源简介：

OptMATH-Train包含超过20万个高质量和多样化的优化问题，涵盖物流、供应链、制造等多种优化场景。OptMATH-Bench是一个具有挑战性的基准测试，包含‘困难实例’，特点是自然语言上下文较长、约束复杂，并涵盖多种问题类型（LP、MILP、IP、NLP、SOCP）。

OptMATH-Train encompasses over 200,000 high-quality and diverse optimization problems, spanning a range of optimization scenarios including logistics, supply chain, and manufacturing. OptMATH-Bench represents a challenging benchmark test featuring 'difficult instances', characterized by longer natural language contexts, complex constraints, and coverage of multiple problem types (LP, MILP, IP, NLP, SOCP).

创建时间：

2025-05-02

原始信息汇总

OptMATH数据集概述

数据集简介

OptMATH是一个可扩展的双向数据合成框架，专注于优化建模领域的高质量数据集生成。该框架通过双向管道实现：

从种子数学公式生成可控复杂度的优化问题数据
通过反向翻译创建自然语言描述
通过前向建模和拒绝采样验证自然语言与问题数据的对应关系

主要组成部分

OptMATH-Train

包含超过20万条高质量、多样化的优化问题
覆盖物流、供应链、制造等多种应用场景

OptMATH-Bench

包含具有挑战性的"困难实例"，特点包括：
- 扩展的自然语言上下文（比MAMO EasyLP长2.9倍）
- 复杂约束条件
- 覆盖多种问题类型（LP、MILP、IP、NLP、SOCP）

关键特性

可扩展的优化建模数据合成框架
通过53个种子生成器覆盖10+实际应用场景
在多个基准测试中达到最先进的性能

实验结果

最佳模型OptMATH-Qwen2.5-32B在所有基准测试中表现优异
即使使用少量OptMATH-Train数据，模型也能显著提升优化建模能力

引用信息

bibtex @inproceedings{Lu2025OptMATHAS, title={OptMATH: A Scalable Bidirectional Data Synthesis Framework for Optimization Modeling}, author={Hongliang Lu and Zhonglin Xie and Yaoyu Wu and Can Ren and Yuxuan Chen and Zaiwen Wen}, year={2025}, url={https://api.semanticscholar.org/CorpusID:276407996} }

联系方式

Hongliang Lu: lhl@pku.edu.cn
Zhonglin Xie: zlxie@pku.edu.cn
Zaiwen Wen: wenzw@pku.edu.cn

搜集汇总

数据集介绍

构建方式

在优化建模领域，OptMATH框架采用创新的双向数据合成方法构建数据集。该框架通过种子数学公式生成具有可控复杂度的优化问题数据，随后利用反向翻译技术转化为自然语言描述，最终通过前向建模和拒绝采样验证数据一致性。这一流程覆盖了物流、供应链等10余个实际应用场景，基于53个种子生成器构建出规模庞大的训练集。

特点

作为优化建模领域的前沿数据集，OptMATH展现出显著的多维特性。OptMATH-Train包含20万条高质量优化问题实例，其多样性体现在涵盖线性规划、混合整数规划等多种问题类型。而OptMATH-Bench则聚焦具有挑战性的复杂实例，其自然语言上下文长度达到基准数据的2.9倍，且包含各类复杂约束条件，为评估大语言模型的优化建模能力提供了严格标准。

使用方法

该数据集的应用价值主要体现在模型训练与性能评估两个维度。研究者可利用OptMATH-Train进行模型微调，实验表明即使使用部分数据也能显著提升模型的优化建模能力。对于性能验证，OptMATH-Bench通过其精心设计的复杂实例，能够全面评估模型处理长上下文、复杂约束等挑战性任务的表现。数据集采用标准化格式存储，支持主流机器学习框架直接调用。

背景与挑战

背景概述

OptMATH-Train和OptMATH-Bench数据集由北京大学研究人员Hongliang Lu、Zhonglin Xie、Zaiwen Wen等人于2025年提出，旨在解决优化建模领域的高质量数据稀缺问题。该数据集通过可扩展的双向合成框架，将数学形式化描述与自然语言描述相互转换，覆盖物流、供应链、制造等10余个实际应用场景，包含超过20万条高质量优化问题实例。作为首个系统化生成优化建模数据的研究成果，OptMATH显著提升了大型语言模型在复杂优化问题求解方面的能力，其创新性的数据合成方法为运筹学与人工智能的交叉研究提供了重要基准。

当前挑战

在解决优化建模问题的语义理解与数学表达转换这一核心挑战时，OptMATH面临自然语言描述与数学形式化严格对应的验证难题，需要通过前向建模和拒绝采样进行双重校验。数据集构建过程中，研究团队需攻克多类型优化问题（包括线性规划、混合整数规划、非线性规划等）的复杂度控制技术，同时确保生成的实例具有足够的多样性和现实意义。基准测试集OptMATH-Bench特别设计了超长上下文描述和复杂约束条件，这对评估模型的真实推理能力提出了更高要求。

常用场景

经典使用场景

在运筹学与数学优化领域，OptMATH-Train和OptMATH-Bench数据集为研究者提供了丰富的优化建模实例。这些数据集广泛应用于算法开发与性能评估，特别是在处理复杂约束条件和多目标优化问题时表现出色。研究者可以利用这些数据验证新型优化算法的鲁棒性和效率，从而推动优化理论的前沿发展。

衍生相关工作

基于OptMATH数据集，研究者开发了多个先进的优化模型，如OptMATH-Qwen2.5系列。这些工作显著提升了大型语言模型在优化任务中的表现，并催生了新的研究方向，如自然语言到数学形式的自动转换。数据集的开源性也促进了学术界在优化领域的协作创新。

数据集最近研究