five

ISOMORPH

收藏
arXiv2026-05-13 更新2026-05-15 收录
下载链接:
https://github.com/tuhinsahai/ISOMORPH
下载链接
链接失效反馈
官方服务:
资源简介:
ISOMORPH是由多机构联合创建的首个公开多级物流网络数字孪生数据集,旨在填补供应链物流领域时间序列预测基准的空白。该数据集通过模拟器生成,包含两种目录规模(C=50和C=200),时间分辨率为每日,覆盖13个节点网络,生成的数据量庞大,并整合了30个场景滚动和20个拉丁超立方扰动,以捕捉真实供应链动态。数据集创建过程基于用户可配置的拓扑结构、需求过程和库存策略,通过离散时间马尔可夫链模型精确模拟库存、在途运输及需求估计等状态轨迹。其核心应用领域为供应链时间序列预测基准测试,能够有效评估基础模型在方差放大、级联瓶颈和制度转换等复杂动态下的性能,并为参数不确定性下的前向不确定性量化提供支持。
提供机构:
马萨诸塞大学阿默斯特分校; SRI国际研究院; 北卡罗来纳大学; 加州理工学院
创建时间:
2026-05-13
原始信息汇总

ISOMORPH 数据集概述

基本信息

ISOMORPH 是一个多层级物流网络的数字孪生系统,同时包含零样本基础模型评估工具。该数据集及配套代码源自论文 ISOMORPH: A Supply Chain Digital Twin for Simulation, Dataset Generation, and Forecasting Benchmarks(arXiv: 2605.12768)。

数据集构成

发布内容

  1. 模拟器simulator/):生成所有已发布数据集的核心组件
  2. 零样本评估脚本eval/):支持四种时间序列基础模型(Chronos、Moirai、TimesFM、Lag-Llama)的滚动原点推理和指标计算
  3. 不确定性量化管道uq/):基于拉丁超立方体采样的前向不确定性量化
  4. 验证与图表脚本analysis/):牛鞭效应分析、基线概览、场景族系

数据目录结构

data/ ├── output_item50/ # 基线数据集(C=50) ├── output_item200/ # 基线数据集(C=200) ├── output_mixture/<scenario>/ # 27个场景卷展(C=50) └── output_uq/ ├── manifest.csv # K=20 LHS配置 └── perturb_k01 ... k20/ # 每个LHS样本对应一个卷展

每个卷展包含的文件

  • daily_records.csv
  • shipments.csv
  • service_summary.csv
  • inventory_history.csv
  • backlog_history.csv
  • intransit_history.csv
  • demand_signals.npydemand_signals_cols.txt
  • scenario.json(CLI参数记录)
  • 可选:edge_list.csvedge_utilisation.npyedge_saturation.npy

数据集约定

  • 时间步长:1步 = 1天
  • 时间跨度:T = 52,560 天
  • 随机种子:所有已发布运行使用种子 2025
  • 管道乘数:release中使用 m = 7

场景设计

基线数据集

  • C = 50 和 C = 200 两种配置
  • 使用 pipeline_mult 7seed 2025

场景扫描(6种单变量扫描 + 2种复合场景)

扫描类型 扰动的参数 设置范围
漂移 (Drift) phi_lo, phi_hi 0.71, 0.86, 0.96, 0.99, 0.9993
冲击 (Shock) shock_count_scale, shock_height_scale (0,1), (0.5,0.7), (1,1), (2,2), (3,4)
爆发 (Burst) burst_rate_scale, burst_height_scale (1,1), (1.5,2), (2,3), (3,4), (5,8)
边容量 (Edge cap) containers_scale 0.3, 0.6, 1.0, 1.5, 2.5
缓冲区 (Buffer) ss_scale 0.1, 0.2, 0.5, 0.75, 1.0
提前期 (Lead time) leadtime_scale 1.0, 2.0, 5.0, 10.0, 20.0

复合场景

  • chaos_compound: phi_lo=0.96, phi_hi=0.98, shock_count_scale=3, shock_height_scale=4
  • chaos_burst: phi_lo=0.96, phi_hi=0.98, burst_rate_scale=3, burst_height_scale=4

评估方法

零样本基础模型评估

  • 支持模型:Chronos、Moirai、TimesFM、Lag-Llama
  • 评估参数:L=512, H=30, stride=30, num_samples=20(TimesFM使用确定性分位数头)
  • 聚合指标:GIFT-Eval风格的MASE

不确定性量化

  • 使用K=20的拉丁超立方体采样
  • 对需求侧三个参数进行扰动(phi_AR, rho_G, rho_B)
  • 生成预测包络图

验证分析

  • 牛鞭效应分析:按节点和层级计算牛鞭比
  • 基线概览图:展示系统整体行为
  • 场景族系图:对比不同场景的系统响应

技术环境

  • Python 3.12
  • PyTorch + CUDA
  • 单张NVIDIA RTX 2080 Ti即可运行所有实验
  • Lag-Llama在L=512配置下最长运行时间不超过5小时/数据集

许可协议

  • 代码:MIT License
  • 生成的数据集和图表:CC-BY-4.0 License
搜集汇总
数据集介绍
main_image_url
构建方式
ISOMORPH 构建于一个多级物流网络的数字孪生框架之上,其核心是一个由用户配置的有向路由图,包含工厂、中间仓库和终端目的地。数据集通过模拟器运行生成,模拟器在离散时间步内推进:需求在目的地到达,优先从库存中满足,未满足部分记录为积压,并触发沿网络的反向补货。模拟器采用马尔可夫链框架,状态向量包含每个节点的现有库存、未完成订单、在途货物及平滑需求估计,从而将动力学封闭在一个高维但可处理的状态空间中。通过调节结构性参数(如拓扑、品类规模C=50或C=200)和场景旋钮(如需求结构、库存策略、运输参数),生成多样化的时序数据,并释放了包括基线滚转、30个场景扫描和20个拉丁超立方扰动在内的完整数据集。
特点
该数据集的核心特点在于其全面且可解释的供应链动力学表达。与仅追踪需求或库存的传统数据集不同,ISOMORPH 的状态向量囊括了未完成订单、在途货物及平滑需求估计,使动力学能够封闭为马尔可夫链,并内嵌了三条路径守恒律(节点质量、全局质量、积压守恒),可作为验证工具。数据集再现了牛鞭效应,且放大倍数与跨行业实证分布一致。此外,数据集展现了固定时序基准中缺失的复杂动态:方差放大、级联瓶颈、长期机制转换以及通过共享宏观冲击实现的跨渠道耦合,为时序预测模型提供了新的挑战场景。
使用方法
ISOMORPH 数据集可直接用于时序预测基准评估,支持单变量和多变量预测,预测目标为逐项需求序列。用户可采用零样本方式评估预训练基础模型(如Chronos、Moirai、TimesFM、Lag-Llama),在短中预测视野(h≤30)下计算MASE指标,并与GIFT-Eval参考值对比。模拟器完全开源模块化,允许用户自定义拓扑、时间分辨率、需求过程和补货策略,生成定制数据集。数据集还支持向前不确定性量化:通过拉丁超立方采样扰动需求侧旋钮生成多条轨迹,基础模型可在零样本下作为数字孪生的快速代理,产生预测置信带,而无需重新运行模拟器。
背景与挑战
背景概述
ISOMORPH是由马萨诸塞大学阿默斯特分校与SRI国际研究院等机构的研究人员于2026年提出的首个公开的多级物流网络数字孪生数据集。该数据集的核心研究问题在于弥补现有时间序列预测基准(如零售、能源、天气等领域)在供应链物流这一关键应用领域的空白。ISOMORPH通过构建一个完全可解释、用户可配置参数的有向路由图,模拟了从工厂到仓库再到客户的多级供应链动态,包括需求到达、库存服务、订单补货等完整过程。该数据集的影响力在于为时间序列预测领域引入了物流域特有的复杂动态特征,如牛鞭效应、级联瓶颈、机制转移和跨通道耦合,为预训练基础模型的零样本评估提供了新的挑战,并推动了数字孪生与机器学习基准的融合。
当前挑战
ISOMORPH所解决的领域挑战是供应链物流时间序列预测的缺失,现有基准无法捕捉库存状态、运输边缘容量和控制决策等网络层面的耦合动态。构建过程中面临的技术挑战包括:设计能够闭合成马尔可夫链的状态空间(需跟踪每个节点的库存、在途货物、待处理订单及平滑需求估计),并在52,560个时间步上保持可计算的确定性转移函数;实现基于Dijkstra路由的贪婪装箱算法以模拟有限容量运输;构建包含季节性、漂移、突发和宏观冲击的五分量需求强度生成器;通过拉丁超立方体采样生成用于前向不确定性量化的参数扰动集合,并确保所有释放数据均能复现与实证一致的牛鞭效应现象,同时通过三条守恒定律验证模拟器的实现保真度。
常用场景
经典使用场景
在供应链物流这一关键但长期被忽视的时序预测领域中,ISOMORPH数据集作为首个公开的多层级物流网络数字孪生体,其最经典的使用场景是为多层级、多梯队的供应链系统生成高保真的时间序列数据。研究者可利用该数据集模拟从源头工厂、中间仓库到最终目的地的全链路物料流动过程,在具有可配置拓扑结构、需求过程和控制规则的环境下,捕捉牛鞭效应、方差放大、级联瓶颈、机制转移以及共享宏观冲击下的跨通道耦合等固有时序模式,从而为物流网络的行为分析提供了一套完整、可重复的实验平台。
衍生相关工作
ISOMORPH的提出已催生了一系列富有启发性的衍生工作。在方法论层面,该数据集启发了如何将离散守恒定律嵌入深度学习架构的研究方向,推动了物理信息时序预测模型的发展,如结构感知的Transformer变体被设计用来显式满足质量守恒和积压守恒。在评估框架层面,该数字孪生与GIFT-Eval等跨领域基准的整合计划为物流预测的标准范式提供了范本,促使研究者关注控制策略与拓扑结构对模型泛化性能的深层影响。此外,基于该仿真器进行的零样本正向不确定性量化研究,展现了基础模型作为高效替代体的可能性,为后续将生成式AI用于复杂系统工程分析与决策支持开辟了新的路径。
数据集最近研究
最新研究方向
ISOMORPH作为多级供应链数字孪生体,当前前沿研究方向聚焦于将数字孪生生成的复杂时序数据与预训练时序基础模型(如Chronos、Moirai、TimesFM、Lag-Llama)进行零样本评估,验证其在物流领域预测任务中的泛化能力。研究重点包括:重现供应链中经典的牛鞭效应并验证其幅度与实证数据一致;通过拉丁超立方采样对参数不确定性进行前向不确定性量化,生成置信区间;揭示时序基础模型在长预测窗口(h≥14)下的MASE值显著高于公开基准GIFT-Eval,表明物流领域动态模式对现有模型构成独特挑战。该数据集为供应链时序预测提供了首个可解释、可配置的公共基准,填补了该领域长期存在的空白,对推动物流智能决策和模型鲁棒性评估具有重要学术与应用价值。
相关研究论文
  • 1
    ISOMORPH: A Supply Chain Digital Twin for Simulation, Dataset Generation, and Forecasting Benchmarks马萨诸塞大学阿默斯特分校; SRI国际研究院; 北卡罗来纳大学; 加州理工学院 · 2026年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作