Large-TA benchmark 和 Known-Optima Benchmark

arXiv2021-03-21 更新2024-08-06 收录

下载链接：

http://arxiv.org/abs/2102.08778v2

下载链接

链接失效反馈

官方服务：

资源简介：

本论文介绍了两个针对作业车间调度问题（JSSP）的大型基准数据集：Large-TA benchmark和Known-Optima Benchmark。Large-TA benchmark是对Taillard基准的扩展，包含90个实例，覆盖从10x10到1000x1000的规模，最大实例包含一百万个操作。Known-Optima Benchmark则包含24个实例，模拟了工业场景中的复杂产品和多样化任务，最大实例包含十万操作。这两个数据集旨在解决传统基准数据集规模不足的问题，更贴近现代工业标准，为研究提供了更丰富的实验环境。

This paper introduces two large-scale benchmark datasets for the Job Shop Scheduling Problem (JSSP): Large-TA benchmark and Known-Optima Benchmark. The Large-TA benchmark, an extension of the Taillard benchmark, consists of 90 instances ranging in scale from 10×10 to 1000×1000, with the largest instance containing one million operations. The Known-Optima Benchmark, on the other hand, includes 24 instances that simulate complex products and diverse tasks in industrial scenarios, with its largest instance containing 100,000 operations. These two datasets aim to address the insufficient scale problem of traditional benchmark datasets, better align with modern industrial standards, and provide a more enriched experimental environment for research.

提供机构：

未知

创建时间：

2021-01-26

搜集汇总

数据集介绍

构建方式

在作业车间调度问题研究领域，现有基准数据集常因规模有限而难以反映真实工业场景。为弥合这一差距，本研究构建了Large-TA与Known-Optima两大基准。Large-TA基准延续了Taillard基准的生成逻辑，通过扩展作业与机器的数量，生成了从10×10到1000×1000共九组规模递增的矩形实例，每组包含10个实例，最大实例涉及百万级操作。Known-Optima基准则采用了一种创新方法：首先基于预设的最优完工时间、机器数与操作数，在时间连续体上随机划分出无空闲间隔的最优调度方案；随后，通过随机生成操作间的后继关系，构建出具有已知最优解的调度实例，并进一步区分了短作业与长作业两种生成策略，以模拟不同复杂度的生产情境。

使用方法

该数据集以文本文件形式组织，分别存放于Large-TA与Known-Optima两个目录中。每个文件首行标注了作业数与机器数，后续每行描述一个作业及其操作序列：每个操作由机器编号与处理时间组成。Known-Optima文件在每行末尾以“-1 -1”标识作业结束。研究者可通过解析这些文件加载问题实例。为便利使用，作者同时提供了基于CP Optimizer与OR-Tools两大约束求解器的Java编码示例，涵盖基础、半基础及高级三种模型。用户可通过命令行指定求解器、数据集、输入子目录、超时时间及线程数等参数，直接对基准实例进行求解与实验，从而高效评估与比较不同调度算法的性能。

背景与挑战

背景概述

在工业调度理论领域，作业车间调度问题（JSSP）作为经典组合优化难题，长期受到学术界与工业界的广泛关注。传统基准测试集如Taillard基准（1993年）虽奠定了研究基础，但其规模局限于百级作业与数十台机器，难以匹配现代工业场景中千级规模调度需求。为此，Giacomo Da Col与Erich C. Teppan于2021年提出了Large-TA与Known-Optima两大基准测试集，旨在弥合理论研究与工业实践间的鸿沟。Large-TA基准通过扩展Taillard生成逻辑，构建了从10×10至1000×1000的大规模矩形实例；Known-Optima基准则创新性地预设最优解结构，模拟了半导体等行业中周计划周期的复杂调度场景。这两套基准的推出，为约束规划与元启发式算法提供了贴近现实的评估平台，显著推动了大规模调度算法的实证研究进展。

当前挑战

该数据集主要应对两大核心挑战：其一，在领域问题层面，传统JSSP基准规模有限，无法有效评估算法在千级作业与机器规模下的性能，而工业场景常需处理高维度、非矩形约束的调度问题，如多工序异构机器分配与动态优先级调整；其二，在构建过程中，生成兼具现实性与可解性的大规模实例面临多重困难：Large-TA需在扩展Taillard方法时保持计算可行性，避免组合爆炸；Known-Optima则需设计复杂生成机制，在保证已知最优解的前提下，模拟短作业与长作业的混合分布，同时精确控制工序长度与机器负载均衡，以反映真实工业数据的时间粒度与资源约束特征。

常用场景

经典使用场景

在工业调度领域，Large-TA与Known-Optima基准测试集为大规模作业车间调度问题提供了标准化评估环境。这些基准测试集通过模拟真实工业场景中的复杂调度任务，如半导体制造中的周度生产计划，为研究者提供了从10×10到1000×1000规模不等的实例，涵盖多达百万级操作数，从而支持对调度算法在大规模问题上的性能进行系统化验证与比较。

解决学术问题

该数据集解决了传统作业车间调度基准测试规模有限、与工业实际脱节的核心学术问题。通过提供大规模实例，它使研究者能够深入探究调度算法在复杂资源约束下的可扩展性与鲁棒性，弥合了理论模型与工业应用之间的鸿沟。其意义在于推动了调度优化研究向更贴近实际的方向发展，为算法设计提供了更严谨的评估标准，促进了约束规划与启发式方法在工业调度中的创新应用。

实际应用

在实际工业场景中，该数据集被广泛应用于半导体制造、汽车装配等领域的生产调度系统优化。例如，企业可利用这些基准测试集评估调度算法在应对上千台机器、数千项作业的周度生产计划时的效率，从而提升资源利用率、缩短制造周期。数据集中的已知最优解实例还为实时调度决策提供了质量验证工具，助力工业系统实现动态、精准的生产排程。

数据集最近研究