kosiasuzu/london-cvrptw-dyamaic-optimization-rl

Name: kosiasuzu/london-cvrptw-dyamaic-optimization-rl
Creator: kosiasuzu
Published: 2026-04-25 15:20:26
License: 暂无描述

Hugging Face2026-04-25 更新2026-04-26 收录

下载链接：

https://hf-mirror.com/datasets/kosiasuzu/london-cvrptw-dyamaic-optimization-rl

下载链接

链接失效反馈

官方服务：

资源简介：

LondonDynamicRouting数据集是为OpenReward环境中的动态、多时间范围、考虑天气和交通的车辆路径规划任务设计的。数据集包含100个难度递增的任务，分为教程（5个）、训练（70个）和测试（25个）三个部分。数据格式为parquet文件，每行代表一个完全指定的确定性事件，包含任务ID、难度、分割、日期、时间范围、车辆、请求、节点、距离矩阵、持续时间矩阵、天气时间线、交通事件、动态事件等信息。数据集使用真实伦敦道路网络，并考虑了天气和交通动态变化。

The LondonDynamicRouting dataset is designed for dynamic, multi-horizon, weather- and traffic-aware vehicle routing tasks in the OpenReward environment. It includes 100 tasks of monotonically increasing difficulty, partitioned into tutorial (5), train (70), and test (25) splits. The data is stored in a parquet file, with each row representing a fully-specified, deterministic episode. Key columns include task ID, difficulty, split, date, horizon, vehicles, requests, nodes, distance matrix, duration matrix, weather timeline, traffic events, and dynamic events. The dataset utilizes the real London road network and accounts for dynamic weather and traffic conditions.

提供机构：

kosiasuzu

搜集汇总

数据集介绍

构建方式

本数据集基于OpenReward平台构建，聚焦于伦敦真实路网下的动态车辆路径规划问题。通过整合开源地图服务OSRM获取道路距离与行驶时长，结合Open-Meteo历史气象数据与Transport for London开放数据，形成了包含天气、交通事件及动态订单的多源异构任务场景。数据集共生成100个难度递增（1至100）的确定性任务，每个任务由任务ID唯一确定。为满足强化学习训练需求，所有任务按5:70:25比例划分为tutorial、train与test三个子集，其中前5个简单任务不含动态事件，确保基线方法可完全求解。

使用方法

使用者可直接通过Pandas读取提供的tasks.parquet文件，其中每一行对应一个完整任务描述，包含站点、车辆、请求、距离矩阵、天气与动态事件等所有关键字段。更便捷的方式是利用OpenReward客户端按split筛选任务，例如通过env.list_tasks(split='tutorial')快速获取入门级任务。由于任务已预置OR-Tools基线性能指标，研究人员可以此作为强化学习或大语言模型方法的对照基准。加载后，根据任务规范依次输出动作序列即可完成交互评分。

背景与挑战

背景概述

伦敦动态路径规划数据集（LondonDynamicRouting）由Kosi、Daniel与Kayode等研究人员于2026年OpenReward EnvCommons黑客松期间创建，致力于解决现实世界中复杂的车辆路径问题（VRP）。该数据集以伦敦真实路网为基底，首次将动态多时段调度、天气与交通事件的时变性、异构车队以及带有时间窗的取送货需求（PDPTW）融为一体。通过100个难度递增的确定性任务实例，它为强化学习（RL）与运筹优化基线（如OR-Tools）提供了可复现的标准化评测平台，填补了动态城市物流在开源数据与闭环评估方面的关键空白，推动了从静态VRP向动态、真实场景迁移的研究范式。

当前挑战

该数据集所应对的核心挑战涵盖两大层面。其一，在领域问题层面，传统VRP假设静态需求与确定化路网，而现实物流中天气骤变、交通拥堵、新订单实时涌现和车辆故障等动态事件频繁发生，亟需算法具备在线重规划与多步前瞻决策能力。其二，在构建过程中，数据集须精确融合OpenStreetMap的实时路距、Open-Meteo的逐时气象记录与Transport for London的公开兴趣点数据，并确保多源异构信息在ODbL许可下兼容一致。此外，任务生成需在100级难度梯度上保持可堆叠性与确定性种子机制，同时使OR-Tools在简单任务上可求解、在困难任务上暴露局限性，以有效区分不同决策智能体的性能边界。

常用场景

经典使用场景

伦敦动态路径规划数据集（London Dynamic Routing）为强化学习与运筹优化交叉领域注入了鲜活的城市脉动。在真实伦敦路网拓扑结构之上，该数据集巧妙融合了多时间窗、异构车队、乘客请求动态涌现及天气交通实时扰动等复杂要素，构建出高保真的智能调度挑战场。研究者可将其作为动态车辆路径问题（Dynamic VRP）的基准测试集，利用任务难度从1至100的渐进式设计，系统评估智能体在时变环境下的决策鲁棒性与泛化能力，尤其在探索多步前瞻规划与实时再调度策略的统一框架中扮演不可或缺的标尺角色。

解决学术问题

该数据集精准回应了传统静态路径规划研究与现实城市物流调度之间的鸿沟。通过纳入动态事件——如全新请求的随机插入、车辆突发故障及运输能力波动——它弥补了经典模型对不确定性建模的缺失，将问题从理想化的确定型组合优化推向更具挑战性的部分可观测马尔可夫决策过程（POMDP）。其内置的OR-Tools基线提供了可复现的对比锚点，使学术界得以清晰量化深度强化学习算法在应对实时扰动、维持高服务率与低运营成本之间的性能增益，从而推动了城市智能运输系统理论从静态近似向动态自适应的范式跃迁。

实际应用

在实际物流与出行服务领域，该数据集为城市级调度系统的研发提供了逼真沙盘。企业可基于从伦敦420平方英里路网中提取的220个地理兴趣点与历史天气轨迹，训练具备天气感知能力的配送车队调度模型，使车辆在高降水或低能见度条件下自动调整路径优先级。其多仓库、多车型架构直接映射了电商最后一公里配送与网约车拼单服务中的异构资源分配难题，而15分钟决策粒度的设计则契合了即时物流的实时响应需求，为无人配送车和动态公交线路编排等前沿应用注入了可验证的算法原型。

数据集最近研究