five

AutoOpt-11k

收藏
arXiv2025-10-24 更新2025-10-29 收录
下载链接:
https://www.kaggle.com/datasets/ankurzing/autoopt-11k
下载链接
链接失效反馈
官方服务:
资源简介:
AutoOpt-11k 是一个包含超过 11,000 个手写和印刷的数学优化模型图像的数据集,这些模型对应于单目标、多目标、多级和随机优化问题,具有各种复杂性,如非线性、非凸性、不可微性、不连续性和高维性。数据集由 25 名专家根据道德数据创建指南创建,并经过两阶段验证以避免错误。数据集内容涵盖从科学、工程、商业和相关领域的小型到大型理论问题和实际生活问题,包括约束优化、无约束优化、线性优化、非线性优化、凸优化、非凸优化、单目标优化和多目标优化等。数据集包括手写和印刷的数学模型图像,并提供其 LaTeX 表示形式,以及 PYOMO 表示形式的子集。
提供机构:
印度艾哈迈达巴德印度管理学院
创建时间:
2025-10-24
原始信息汇总

AutoOpt-11k 数据集概述

数据集基本信息

  • 数据集名称: AutoOpt-11k Dataset of Optimization Problems
  • 创建者: Ankur Sinha
  • 更新时间: 7天前
  • 数据量: 11,554张图像
  • 用途: 用于自动化优化问题求解的图像到文本数据集

数据集内容

数据构成

  • 图像类型: 包含排版(印刷)和手写两种类型的数学优化问题图像
  • 标签信息:
    • 所有11,554张图像均提供对应的LaTeX代码标签
    • 1,018张图像子集额外提供对应的Pyomo脚本标签
  • 数据格式:
    • 图像文件夹(11.6k个文件)
    • Latex.txt文件(2.81 MB)
    • data.jsonl文件(4.32 MB)
    • metadata.csv文件(715.6 kB)

问题类型覆盖

  • 领域范围: 商业、工程、科学及相关领域
  • 问题复杂度:
    • 单目标、多目标、多层级、随机优化问题
    • 无约束/有约束、线性/非线性、凸/非凸
    • 连续/不连续、可微/不可微、低维/高维

数据分布

  • 排版图像: 6,484张
  • 手写图像: 5,070张

技术特性

  • 许可证: CC BY-NC-SA 4.0
  • 更新频率: 每年
  • 可用性评分: 8.24
  • 标签: Image、Text、Artificial Intelligence、Optimization、Image-To-Text

文件结构

final/ ├── Images/ (11.6k files) ├── Latex.txt (2.81 MB) ├── data.jsonl (4.32 MB) └── metadata.csv (715.6 kB)

搜集汇总
数据集介绍
main_image_url
构建方式
在数学优化领域,图像化数学模型的机器可读性转换长期面临技术瓶颈。AutoOpt-11k数据集通过系统化构建流程突破这一局限:由25名具有工程与商业背景的专家团队,从经典教材、研究论文及开源库中精选11,554个优化问题样本,涵盖手写与印刷两种形式。构建过程采用双阶段验证机制——首阶段由20名标注者从多元来源采集问题样本,次阶段由5名编程专家生成LaTeX代码与PYOMO脚本,并通过逆向生成图像比对确保标注准确性,最终达成平均BLEU评分0.857的标注者间一致性。
特点
该数据集展现出显著的领域专业性与结构多样性:不仅覆盖单目标、多目标、多层级及随机优化等核心问题类型,更囊括非线性、非凸性、不可微等复杂数学特性。其样本包含5,070个手写图像与6,484个印刷图像,在呈现形式上兼顾紧凑矩阵表示与标量表达式,在参数定义上平衡通用形式与完全数值定义。特别值得注意的是,数据集通过引入书写媒介差异(纸张类型、墨水颜色)、采集条件变化(拍摄角度、光照强度)以及数学符号的多元表达(如x^(0.5)与√x的并行收录),构建出高度贴近真实应用场景的生态有效性。
使用方法
该数据集主要服务于优化问题的自动化求解 pipeline 构建:通过三阶段模块化架构实现端到端处理。模块M1采用混合深度学习架构(ResNet-101与Swin Transformer融合),将输入图像转换为LaTeX代码;模块M2基于微调的DeepSeek-Coder模型,将LaTeX代码进一步编译为PYOMO建模语言脚本;模块M3则通过双层优化分解算法执行数值求解。在实际应用中,用户仅需提交数学模型图像,系统即可在字符错误率2.86%的精度下自动生成可执行解决方案,其端到端成功率达94.2%,为教育、科研及工业场景提供了高效的优化问题求解基础设施。
背景与挑战
背景概述
AutoOpt-11k数据集于2025年由印度管理学院艾哈迈达巴德分校的Ankur Sinha等学者创建,专为数学优化问题自动化求解而设计。该数据集包含11,554张手写与印刷格式的数学优化模型图像,涵盖单目标、多目标、多层级及随机优化等复杂问题类型,并标注了对应的LaTeX代码与部分PYOMO建模语言脚本。其核心研究目标在于弥合图像格式数学程序与机器可读格式之间的语义鸿沟,推动计算机视觉与优化理论的交叉融合,为自动化优化求解系统提供关键数据支撑。
当前挑战
该数据集致力于解决复杂数学优化问题的机器可读转换难题,其核心挑战在于多行数学表达式的二维结构解析,包括上下标、分式及矩阵等空间语义关系的准确识别。构建过程中面临标注一致性与多样性的平衡困境:需协调25名标注者对数学符号的异构书写风格与排版变体进行标准化,同时通过两阶段验证机制克服LaTeX代码与原始图像间的语义偏差,确保跨标注者间BLEU评分达0.8187以上的协同精度。
常用场景
解决学术问题
该数据集有效解决了优化领域长期存在的机器可读性障碍问题。传统上,数学规划图像缺乏语义结构,难以被计算机直接理解和处理。AutoOpt-11k通过提供超过11,000个标注样本,支持开发能够理解复杂数学表达式的深度学习模型,包括处理非线性、非凸、不可微等复杂特性的优化问题。这一突破使得自动化优化问题求解成为可能,为计算机视觉与数学优化的交叉研究奠定了数据基础。
衍生相关工作
基于AutoOpt-11k数据集,衍生出了多个重要的研究方向。在数学表达式识别方面,研究者开发了融合ResNet与Swin Transformer的混合架构,显著提升了复杂数学程序的识别精度。在优化求解方法上,双层次优化分解策略的创新应用,使得系统能够同时利用精确方法和启发式算法的优势。此外,该数据集还促进了LaTeX到建模语言的转换模型发展,为后续的自动化数学推理研究提供了重要参考。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作