Anonymous-LaEx/Anonymous-LaDe
收藏Hugging Face2023-11-09 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Anonymous-LaEx/Anonymous-LaDe
下载链接
链接失效反馈官方服务:
资源简介:
LaDe是一个公开的最后一公里配送数据集,包含来自行业的数百万个包裹。它具有三个独特特点:(1) 大规模。它涉及6个月真实运营中的21,000名快递员的10,677,000个包裹。(2) 信息全面。它提供了原始包裹信息,如位置和时间要求,以及任务事件信息,记录了快递员在任务接受和任务完成等事件发生时的位置和时间。(3) 多样性。数据集包括来自不同场景的数据,如包裹取件和递送,以及来自多个城市的数据,每个城市由于其独特的特点(如人口)而具有独特的时空模式。
LaDe is a public last-mile delivery dataset containing millions of industry-derived parcels. It has three distinct characteristics: (1) Large-scale: It covers 10,677,000 parcels from 21,000 couriers across 6 months of real-world operations. (2) Comprehensive information: It provides both original parcel information such as location and time requirements, and task event information that records the location and time of couriers when events like task acceptance and task completion occur. (3) Diversity: The dataset includes data from various scenarios such as parcel pickup and delivery, as well as data from multiple cities, each with unique spatio-temporal patterns due to their distinctive characteristics such as population.
提供机构:
Anonymous-LaEx
原始信息汇总
数据集概述
数据集名称
LaDe
数据集描述
LaDe 是一个公开可用的最后一公里配送数据集,包含数百万个来自行业的包裹。它具有以下三个独特特点:
- 大规模:涉及10,677k个包裹,由21k名快递员在6个月的实际运营中完成。
- 全面信息:提供原始包裹信息,如位置和时间要求,以及任务事件信息,记录快递员在任务接受和完成事件发生时的时间和地点。
- 多样性:数据集包括来自各种场景的数据,如包裹取件和配送,以及多个城市,每个城市因其独特的时空模式而异。
数据集组成
LaDe 由两个子数据集组成:
- LaDe-D:来自包裹配送场景。
- LaDe-P:来自包裹取件场景。
每个子数据集以CSV格式呈现,包含5个CSV文件,每个文件代表特定城市的数据。
数据集结构
数据集的结构如下:
- ./data/raw/
- delivery
- delivery_sh.csv
- ...
- pickup
- pickup_sh.csv
- ...
- delivery
数据字段描述
LaDe-P
| 数据字段 | 描述 | 单位/格式 |
|---|---|---|
| Package information | ||
| package_id | 每个包裹的唯一标识符 | Id |
| time_window_start | 所需时间窗口的开始 | Time |
| time_window_end | 所需时间窗口的结束 | Time |
| Stop information | ||
| lng/lat | 每个停靠点的坐标 | Float |
| city | 城市 | String |
| region_id | 区域的Id | String |
| aoi_id | AOI(感兴趣区域)的Id | Id |
| aoi_type | AOI的类型 | Categorical |
| Courier Information | ||
| courier_id | 快递员的Id | Id |
| Task-event Information | ||
| accept_time | 快递员接受任务的时间 | Time |
| accept_gps_time | 最接近接受时间的GPS点的时间 | Time |
| accept_gps_lng/lat | 快递员接受任务时的坐标 | Float |
| pickup_time | 快递员取件任务的时间 | Time |
| pickup_gps_time | 最接近取件时间的GPS点的时间 | Time |
| pickup_gps_lng/lat | 快递员取件任务时的坐标 | Float |
| Context information | ||
| ds | 包裹取件的日期 | Date |
LaDe-D
| 数据字段 | 描述 | 单位/格式 |
|---|---|---|
| Package information | ||
| package_id | 每个包裹的唯一标识符 | Id |
| Stop information | ||
| lng/lat | 每个停靠点的坐标 | Float |
| city | 城市 | String |
| region_id | 区域的Id | Id |
| aoi_id | AOI的Id | Id |
| aoi_type | AOI的类型 | Categorical |
| Courier Information | ||
| courier_id | 快递员的Id | Id |
| Task-event Information | ||
| accept_time | 快递员接受任务的时间 | Time |
| accept_gps_time | 最接近接受时间的GPS点的时间 | Time |
| accept_gps_lng/accept_gps_lat | 快递员接受任务时的坐标 | Float |
| delivery_time | 快递员完成配送任务的时间 | Time |
| delivery_gps_time | 最接近配送时间的GPS点的时间 | Time |
| delivery_gps_lng/delivery_gps_lat | 快递员完成任务时的坐标 | Float |
| Context information | ||
| ds | 包裹配送的日期 | Date |
性能评估
路线预测
| 方法 | HR@3 | KRC | LSD | ED |
|---|---|---|---|---|
| TimeGreedy | 59.81 | 39.93 | 5.20 | 2.24 |
| DistanceGreedy | 61.07 | 42.84 | 5.35 | 1.94 |
| OR-Tools | 62.50 | 44.81 | 4.69 | 1.88 |
| LightGBM | 70.63 | 54.48 | 3.27 | 1.92 |
| FDNET | 69.05 ± 0.47 | 52.72 ± 1.98 | 4.08 ± 0.29 | 1.86 ± 0.03 |
| DeepRoute | 71.66 ± 0.11 | 56.20 ± 0.27 | 3.26 ± 0.08 | 1.86 ± 0.01 |
| Graph2Route | 71.69 ± 0.12 | 56.53 ± 0.12 | 3.12 ± 0.01 | 1.86 ± 0.01 |
| DRL4Route | 72.18 ± 0.18 | 57.20 ± 0.20 | 3.06 ± 0.02 | 1.84 ± 0.01 |
预计到达时间预测
| 方法 | MAE | RMSE | ACC@20 |
|---|---|---|---|
| LightGBM | 17.48 | 20.39 | 0.68 |
| SPEED | 23.75 | 27.86 | 0.58 |
| KNN | 21.28 | 25.36 | 0.60 |
| MLP | 18.58 ± 0.37 | 21.54 ± 0.34 | 0.66 ± 0.02 |
| FDNET | 18.47 ± 0.31 | 21.44 ± 0.34 | 0.67 ± 0.02 |
| RANKETPA | 17.18 ± 0.06 | 20.18 ± 0.08 | 0.70 ± 0.01 |
时空图预测
| 方法 | MAE | RMSE |
|---|---|---|
| HA | 4.63 | 9.91 |
| DCRNN | 3.69 ± 0.09 | 7.08 ± 0.12 |
| STGCN | 3.04 ± 0.02 | 6.42 ± 0.05 |
| GWNET | 3.16 ± 0.06 | 6.56 ± 0.11 |
| ASTGCN | 3.12 ± 0.06 | 6.48 ± 0.14 |
| MTGNN | 3.13 ± 0.04 | 6.51 ± 0.13 |
| AGCRN | 3.93 ± 0.03 | 7.99 ± 0.08 |
| STGNCDE | 3.74 ± 0.15 | 7.27 ± 0.16 |
搜集汇总
数据集介绍

构建方式
Anonymous-LaEx/Anonymous-LaDe数据集的构建,依托于物流领域中的最后一公里配送场景,收集了上百万个包裹的实时运营数据。该数据集的构建采用了大规模的包裹配送记录,覆盖了21,000名快递员在6个月内的物流活动,包含了包裹的基本信息、任务事件信息以及丰富的时空坐标数据,形成了对现实世界配送活动的细致模拟。
特点
该数据集具有三个显著特点:一是规模宏大,包含了10,677,000个包裹的数据;二是信息全面,不仅包括包裹的原始信息如位置和时间要求,还有记录快递员在任务接受和完成等事件发生时的位置和时间信息;三是场景多样,涵盖了包裹的取送以及多个城市的独特时空模式,为研究提供了丰富的数据基础。
使用方法
在使用该数据集时,用户可以根据需求选择两个子数据集之一:LaDe-D(配送场景)或LaDe-P(取件场景)。两个子数据集均以CSV格式呈现,便于研究者进行下载和分析。用户在下载前需阅读相关使用条款,并将数据放置在指定的目录结构中,以方便后续的数据处理和分析工作。
背景与挑战
背景概述
在物流配送领域,尤其是最后一公里配送问题,数据集的构建至关重要。Anonymous-LaEx/Anonymous-LaDe数据集,创建于近期,由业界提供,包含数百万包裹的详细信息。该数据集由21,000名快递员在六个月内的真实运营数据组成,其规模之大、信息之全面、场景之多样,为物流配送领域的研究提供了宝贵的资源。其主要研究人员或机构不详,但该数据集以其独特的时空特征和任务事件信息,对理解城市物流配送模式、优化配送路线等方面产生了显著影响。
当前挑战
该数据集在研究领域中面临的挑战主要包括:1) 处理大规模数据时的高效算法设计;2) 多样化场景下的模型泛化能力;3) 如何利用数据集解决实际的最后一公里配送问题,如路线预测、到达时间预测等。构建过程中的挑战则涉及到数据采集、清洗、标注等环节,确保数据的准确性和一致性。
常用场景
经典使用场景
在物流配送领域,Anonymous-LaEx/Anonymous-LaDe数据集因其规模宏大、信息全面及场景多样性的特点,被广泛应用于模拟和分析最后一公里配送问题。该数据集详细记录了包裹信息、配送员行动轨迹以及任务事件,为研究路径规划、预估到达时间以及时空图预测等任务提供了丰富的数据基础。
实际应用
在实际应用中,Anonymous-LaEx/Anonymous-LaDe数据集可被物流公司用于优化配送策略,通过预测配送员的最佳路径和到达时间,提升客户满意度和企业竞争力。同时,该数据集也为城市交通规划和智能交通系统的研究提供了宝贵的数据资源。
衍生相关工作
基于该数据集,学术界已衍生出一系列经典工作,包括路径预测算法、预估到达时间模型以及时空图预测方法等。这些研究成果进一步推动了物流配送领域的智能化发展,为行业带来了革命性的变化。
以上内容由遇见数据集搜集并总结生成



