OptiChat 数据集

Name: OptiChat 数据集
Creator: 普渡大学戴维森化学工程学院
Published: 2025-01-15 03:53:58
License: 暂无描述

arXiv2025-01-15 更新2025-01-17 收录

下载链接：

https://github.com/li-group/OptiChat

下载链接

链接失效反馈

官方服务：

资源简介：

OptiChat 数据集由普渡大学戴维森化学工程学院的研究团队开发，旨在评估 OptiChat 系统在解释优化模型时的性能。该数据集包含 172 个问答对，涵盖了诊断、检索、敏感性、假设和反事实查询五类问题。数据集的内容基于 24 个优化模型，这些模型来自 GAMS 模型库、Pyomo Cookbook 和公开的 GitHub 教程，涵盖了供应链、制造、石油精炼、工业调度等多个领域。数据集的创建过程包括从实际应用中收集问题，并通过专家验证和调整以确保其准确性和实用性。该数据集的应用领域主要集中在帮助非专家用户理解和使用优化模型，旨在解决优化模型与用户之间的沟通障碍，提升决策效率。

The OptiChat Dataset was developed by a research team from the Davidson School of Chemical Engineering at Purdue University, aiming to evaluate the performance of the OptiChat system in explaining optimization models. This dataset contains 172 question-answer pairs, covering five types of queries: diagnostic, retrieval, sensitivity, hypothetical, and counterfactual queries. The content of the dataset is based on 24 optimization models sourced from the GAMS Model Library, Pyomo Cookbook, and publicly available GitHub tutorials, spanning multiple domains including supply chain, manufacturing, petroleum refining, and industrial scheduling. The dataset creation process involves collecting questions from real-world applications, followed by expert validation and refinement to ensure its accuracy and practicality. The primary application scope of this dataset is to assist non-expert users in understanding and utilizing optimization models, with the goal of bridging the communication gap between optimization models and end-users, and improving decision-making efficiency.

提供机构：

普渡大学戴维森化学工程学院

创建时间：

2025-01-15

原始信息汇总

OptiChat 数据集概述

数据集简介

OptiChat 是一个基于 GPT-4 大语言模型（LLM）的交互式对话系统，结合了 Gurobi、Pyomo、预定义函数和代码生成技术，旨在帮助从业者通过自然语言与优化模型进行交互。该项目的目标是通过 LLM 解释优化模型，从而缩小从业者与优化模型之间的差距。

数据集特点

支持的模型类型：OptiChat 支持使用 Pyomo 编写的可行/不可行优化模型。
支持的查询类型：包括诊断、检索、敏感性分析、假设分析和反事实分析等查询。

数据集结构

模型库：模型库位于 Feas 和 Infeas 文件夹中，分别包含可行和不可行的优化模型。
模型开发：OptiChat 目前仅支持使用 Pyomo 编写的优化模型。开发模型时，建议为模型组件添加注释（doc），以便 OptiChat 更好地生成模型描述。

安装与使用

安装依赖：
- 安装 Python3 和 pip。
- 使用 pip install -r requirements.txt 安装 Python 包（注意：requirements.txt 文件尚未更新，可能存在兼容性问题）。
- 安装 Gurobi，并按照提供的视频教程进行配置。
- 申请 OpenAI API 密钥，并将其添加到环境变量中。
运行测试：
- 在根目录下运行 pytest tests/ 以检查 Gurobi 和 GPT 的安装是否成功。
- 运行 streamlit run app.py 启动聊天机器人。
使用教程：
- 在 Upload Model 下选择模型文件（仅支持 .py 文件）。
- 加载模型以生成初始描述并熟悉问题背景。
- 使用聊天界面提交查询。

引用

如果您发现此工作有用，请引用以下文献： bibtex @misc{OptiChat2025, title={OptiChat: Bridging Optimization Models and Practitioners with Large Language Models}, author={Hao Chen and Gonzalo Esteban Constante-Flores and Krishna Sri Ipsit Mantri and Sai Madhukiran Kompalli and Akshdeep Singh Ahluwalia and Can Li}, year={2025}, eprint={2501.08406}, archivePrefix={arXiv}, primaryClass={cs.HC}, url={https://arxiv.org/abs/2501.08406}, }

bibtex @article{OptiChat2023, author = {Chen, Hao and Constante-Flores, Gonzalo~E. and Li, Can}, doi = {10.1080/03155986.2024.2385189}, issue = {0}, journal = {INFOR: Information Systems and Operational Research}, publisher = {Taylor & Francis}, title = {Diagnosing infeasible optimization problems using large language models}, volume = {62}, number = {4}, pages = {1-15}, url = {https://doi.org/10.1080/03155986.2024.2385189}, year = {2024}, }

搜集汇总

数据集介绍

构建方式

OptiChat数据集的构建基于优化模型与从业者之间的交互需求，旨在通过自然语言对话系统帮助从业者理解、诊断和分析优化模型。数据集的构建过程包括从多个领域的优化模型中提取问题，并通过Pyomo/Python建模语言生成相应的代码脚本。这些模型涵盖了供应链、制造、石油精炼、工业调度等多个应用场景。为了确保数据的多样性和复杂性，研究人员还创建了不可行模型的变体，通过调整参数或引入额外约束来模拟现实中的不可行情况。最终，数据集包含了172个问题-答案对，涵盖了诊断、检索、敏感性分析、假设分析和反事实解释等五类查询。

使用方法

OptiChat数据集的使用方法主要围绕自然语言对话系统的评估和优化展开。研究人员可以通过数据集中的问题-答案对，测试系统在解释优化模型时的准确性和响应速度。具体而言，数据集中的查询分为解决方案无关查询和解决方案相关查询，前者通过大语言模型的上下文推理直接回答，后者则通过与优化工具的交互生成准确的解释。研究人员可以利用数据集中的预定义函数和代码生成功能，评估系统在处理复杂查询时的表现。此外，数据集还可用于训练和微调大语言模型，以提高其在优化领域的解释能力。通过这种方式，OptiChat数据集为优化模型与从业者之间的无缝交互提供了重要的研究基础。

背景与挑战

背景概述

OptiChat数据集由普渡大学Davidson化学工程学院的Hao Chen等人于2025年提出，旨在解决优化模型与从业者之间的沟通鸿沟。优化模型广泛应用于工程、经济、医疗和制造等领域，但其复杂的数学公式往往使非专家从业者难以理解和应用。OptiChat通过结合大语言模型（LLMs）和优化工具，开发了一个自然语言对话系统，帮助从业者解释模型、诊断不可行性、分析敏感性、检索信息、评估修改并提供反事实解释。该数据集的创建标志着优化模型解释领域的重要进展，为从业者提供了更直观、高效的交互方式，减少了对优化专家的依赖。

当前挑战

OptiChat数据集面临的挑战主要体现在两个方面。首先，优化模型的解释本身具有复杂性，尤其是当模型涉及大规模决策变量和约束时，如何生成准确且易于理解的解释成为一大难题。其次，构建数据集时需确保LLMs生成的解释具有高可靠性，避免因模型幻觉导致的错误信息。尽管OptiChat通过预定义函数和代码生成技术减少了幻觉风险，但在处理复杂查询时，LLMs仍可能生成不准确的代码或解释。此外，从业者对模型组件的描述可能存在歧义，进一步增加了LLMs识别和执行任务的难度。这些挑战需要通过更精细的模型训练和数据集扩展来解决，以提升系统的鲁棒性和解释能力。

常用场景

经典使用场景

OptiChat 数据集的核心应用场景在于帮助非优化领域的从业者与复杂的优化模型进行交互。通过自然语言对话系统，从业者能够理解模型构建、诊断不可行性、分析敏感性、检索信息、评估修改方案以及提供反事实解释。这种交互方式极大地降低了从业者与优化模型之间的沟通障碍，使得优化模型的应用更加广泛和高效。

解决学术问题

OptiChat 数据集解决了优化模型与从业者之间的沟通难题。传统上，优化模型由专家开发，但由非专家使用，导致从业者在理解模型结果时面临困难。通过引入自然语言对话系统，OptiChat 使得从业者能够自主地与模型交互，减少了专家与从业者之间的沟通成本，提升了决策效率。此外，该数据集还为优化模型的解释性研究提供了新的基准，推动了优化领域的可解释性研究。

实际应用

在实际应用中，OptiChat 数据集被广泛用于供应链管理、生产调度、化工过程优化等领域。例如，在供应链管理中，从业者可以通过 OptiChat 快速理解模型的建议，评估不同生产策略的影响，并做出更明智的决策。这种应用不仅提高了决策的准确性，还减少了专家与从业者之间的沟通时间，提升了整体运营效率。

数据集最近研究