Cainiao-AI/LaDe-D
收藏Hugging Face2023-06-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Cainiao-AI/LaDe-D
下载链接
链接失效反馈官方服务:
资源简介:
LaDe是一个公开的最后一公里配送数据集,包含来自工业界的数百万个包裹。该数据集具有三个独特特点:(1) 大规模:涉及21,000名快递员在6个月内的10,677,000个包裹。(2) 信息全面:提供原始包裹信息,如位置和时间要求,以及任务事件信息,记录快递员在任务接受和完成时的位置和时间。(3) 多样性:数据集包括来自多个城市的包裹取件和配送数据,每个城市都有其独特的时空模式。
LaDe是一个公开的最后一公里配送数据集,包含来自工业界的数百万个包裹。该数据集具有三个独特特点:(1) 大规模:涉及21,000名快递员在6个月内的10,677,000个包裹。(2) 信息全面:提供原始包裹信息,如位置和时间要求,以及任务事件信息,记录快递员在任务接受和完成时的位置和时间。(3) 多样性:数据集包括来自多个城市的包裹取件和配送数据,每个城市都有其独特的时空模式。
提供机构:
Cainiao-AI
原始信息汇总
数据集概述
数据集名称: LaDe
许可证: Apache-2.0
标签:
- Spatial-Temporal
- Graph
- Logistic
- Last-mile Delivery
大小分类: 10M<n<100M
数据集特征
| 特征名称 | 数据类型 |
|---|---|
| order_id | int64 |
| region_id | int64 |
| city | string |
| courier_id | int64 |
| lng | float64 |
| lat | float64 |
| aoi_id | int64 |
| aoi_type | int64 |
| accept_time | string |
| accept_gps_time | string |
| accept_gps_lng | float64 |
| accept_gps_lat | float64 |
| delivery_time | string |
| delivery_gps_time | string |
| delivery_gps_lng | float64 |
| delivery_gps_lat | float64 |
| ds | int64 |
数据集分割
| 分割名称 | 字节数 | 示例数 |
|---|---|---|
| delivery_jl | 5568309 | 31415 |
| delivery_cq | 168574531 | 931351 |
| delivery_yt | 36796326 | 206431 |
| delivery_sh | 267095520 | 1483864 |
| delivery_hz | 335088000 | 1861600 |
数据集下载信息
- 下载大小: 290229555 字节
- 数据集大小: 813122686 字节
数据集描述
LaDe 是一个公开的最后一公里配送数据集,包含数百万个来自行业的包裹数据。该数据集具有以下特点:
- 大规模: 涉及10,677k个包裹和21k名快递员,覆盖6个月的实际运营数据。
- 信息全面: 提供原始包裹信息,如位置和时间要求,以及任务事件信息,记录快递员在任务接受和完成事件发生时的时间和地点。
- 多样性: 数据集包含多种场景的数据,如包裹取件和配送,以及多个城市,每个城市都有其独特的时空模式。
数据集使用
使用此数据集进行研究时,请引用相关论文:{xxx}
搜集汇总
数据集介绍

构建方式
LaDe-D数据集的构建基于大规模的末端配送数据,涵盖了21,000名快递员在六个月内的实际操作记录。数据集通过收集每个包裹的详细信息,包括其地理位置和时间要求,以及任务事件信息,记录了快递员在任务接受和完成时的具体时间和地点。这些数据来源于多个城市,确保了数据的多场景和多城市特性,从而提供了丰富的时空模式分析基础。
特点
LaDe-D数据集的显著特点在于其大规模、全面性和多样性。首先,数据集包含超过1000万条包裹记录,涉及多个城市的实际配送情况。其次,数据集提供了详细的包裹信息、快递员信息以及任务事件信息,为研究提供了丰富的数据支持。最后,数据集的多样性体现在其涵盖了不同城市和不同配送场景,每个城市因其独特的时空特征而呈现出不同的配送模式。
使用方法
LaDe-D数据集适用于多种研究目的,特别是针对末端配送优化、路径预测和时空图预测等领域的研究。用户可以通过下载CSV格式的数据文件,并按照提供的代码链接进行数据处理和分析。数据集的结构清晰,每个文件代表一个特定城市的配送数据,用户可以根据需要选择特定的城市数据进行分析。此外,数据集还提供了详细的字段描述,帮助用户更好地理解和使用数据。
背景与挑战
背景概述
LaDe-D数据集是由Cainiao-AI团队公开发布的末端配送数据集,涵盖了数百万个来自实际运营的包裹数据。该数据集的创建旨在为研究末端配送领域的学者和从业者提供一个大规模、信息全面且多样化的数据资源。LaDe-D数据集包含了21,000名快递员在六个月内的操作数据,涉及10,677,000个包裹,涵盖了多个城市的不同配送场景。其独特之处在于不仅提供了包裹的基本信息,如位置和时间要求,还记录了快递员在任务接受和完成时的详细事件信息,为研究末端配送的时空模式提供了丰富的数据支持。
当前挑战
LaDe-D数据集在构建过程中面临了多个挑战。首先,数据集的规模庞大,涉及数百万个包裹和数千名快递员,这要求在数据收集和处理过程中具备高效的数据管理能力。其次,数据集包含了多个城市的配送数据,每个城市因其独特的地理和人口特征而呈现出不同的时空模式,这增加了数据分析的复杂性。此外,数据集中的信息全面且详细,包括包裹信息、快递员信息和任务事件信息,如何在保证数据质量的同时进行有效的数据整合和清洗也是一个重要挑战。最后,数据集的多样性要求研究者在分析时考虑到不同场景和城市的特殊性,这为模型的泛化能力提出了更高的要求。
常用场景
经典使用场景
在物流与配送领域,LaDe-D数据集以其大规模和全面性成为研究热点。该数据集涵盖了从订单接收到配送完成的完整流程,为研究人员提供了丰富的时空信息。经典使用场景包括路径预测、预计到达时间(ETA)预测以及时空图预测。通过分析这些数据,研究人员能够优化配送路线,提高配送效率,并预测配送过程中的潜在问题。
衍生相关工作
基于LaDe-D数据集,研究者们开展了多项经典工作。例如,通过时空图预测模型,研究人员能够更准确地预测配送过程中的交通状况,从而优化配送策略。此外,路径预测和ETA预测模型的发展,也为物流企业的运营决策提供了科学依据。这些衍生工作不仅推动了物流与配送领域的技术进步,还为其他相关领域的研究提供了新的思路和方法。
数据集最近研究
最新研究方向
在物流与配送领域,LaDe-D数据集的最新研究方向主要集中在时空图预测和路径优化上。随着城市化进程的加速,末端配送的效率和准确性成为研究热点。研究者们通过构建复杂的时空图模型,分析配送过程中的动态变化,以提高路径规划的精度和实时性。此外,基于深度学习的ETA(Estimated Time of Arrival)预测模型也备受关注,通过融合多源数据,提升配送时间的预测准确度,从而优化整体配送流程。这些研究不仅推动了物流行业的智能化发展,也为城市交通管理提供了新的视角和方法。
以上内容由遇见数据集搜集并总结生成



