Cainiao-AI/LaDe-P|快递物流数据集|时空数据分析数据集
收藏hugging_face2023-06-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Cainiao-AI/LaDe-P
下载链接
链接失效反馈资源简介:
LaDe是一个公开的最后一公里配送数据集,包含来自工业界的数百万个包裹。它具有三个独特特征:(1) 大规模:涉及6个月内21,000名配送员的10,677,000个包裹;(2) 信息全面:提供原始包裹信息(如位置和时间要求)以及任务事件信息(如任务接受和任务完成事件发生的时间和地点);(3) 多样性:数据集包括多种场景(如包裹取件和配送)和多个城市的数据,每个城市都有其独特的时空模式。
LaDe是一个公开的最后一公里配送数据集,包含来自工业界的数百万个包裹。它具有三个独特特征:(1) 大规模:涉及6个月内21,000名配送员的10,677,000个包裹;(2) 信息全面:提供原始包裹信息(如位置和时间要求)以及任务事件信息(如任务接受和任务完成事件发生的时间和地点);(3) 多样性:数据集包括多种场景(如包裹取件和配送)和多个城市的数据,每个城市都有其独特的时空模式。
提供机构:
Cainiao-AI
原始信息汇总
数据集概述
数据集名称: LaDe
许可证: Apache-2.0
标签:
- Spatial-Temporal
- Graph
- Logistic
大小: 10M<n<100M
数据集特征
| 特征名称 | 数据类型 |
|---|---|
| order_id | int64 |
| region_id | int64 |
| city | string |
| courier_id | int64 |
| accept_time | string |
| time_window_start | string |
| time_window_end | string |
| lng | float64 |
| lat | float64 |
| aoi_id | int64 |
| aoi_type | int64 |
| pickup_time | string |
| pickup_gps_time | string |
| pickup_gps_lng | float64 |
| pickup_gps_lat | float64 |
| accept_gps_time | string |
| accept_gps_lng | float64 |
| accept_gps_lat | float64 |
| ds | int64 |
数据集划分
| 划分名称 | 字节数 | 示例数 |
|---|---|---|
| pickup_jl | 54225579 | 261801 |
| pickup_cq | 243174931 | 1172703 |
| pickup_yt | 237146694 | 1146781 |
| pickup_sh | 293399390 | 1424406 |
| pickup_hz | 436103754 | 2130456 |
下载信息
下载大小: 443251368
数据集大小: 1264050348
数据集描述
LaDe是一个公开可用的最后一英里配送数据集,包含数百万个来自行业的包裹。该数据集具有大规模、信息全面和多样性的特点,涵盖了多种场景和多个城市,每个城市都有其独特的时空模式。
引用信息
若使用此数据集进行研究,请引用相关论文: {xxx}
AI搜集汇总
数据集介绍

构建方式
LaDe-P数据集的构建基于大规模的实际物流操作数据,涵盖了21,000名快递员在六个月内处理的10,677,000个包裹。数据集通过收集每个包裹的详细信息,包括地理位置、时间窗口要求以及任务事件信息,如实记录了快递员在任务接受和完成时的具体时间和地点。这些数据经过精细处理,以CSV格式呈现,便于后续分析和研究。
使用方法
LaDe-P数据集适用于多种研究场景,包括但不限于路线预测、预计到达时间预测和时空图预测。用户可以通过访问HuggingFace平台下载数据集,并按照提供的代码链接进行数据处理和分析。数据集的结构清晰,每个文件代表一个特定城市的数据,用户可以根据需要选择特定城市或全部数据进行研究。在使用前,请确保阅读并遵守相关的使用条款。
背景与挑战
背景概述
LaDe-P数据集是由Cainiao-AI团队公开发布的末端配送数据集,涵盖了从多个城市收集的数百万个包裹信息。该数据集的创建旨在为物流和配送领域的研究提供大规模、全面且多样化的数据支持。其核心研究问题包括优化配送路径、预测到达时间以及分析空间-时间图的动态变化。LaDe-P数据集的发布不仅为学术界提供了宝贵的资源,也为工业界提供了实际应用的参考,推动了物流和配送领域的技术进步。
当前挑战
LaDe-P数据集在构建过程中面临了多重挑战。首先,数据集涉及多个城市的复杂配送场景,每个城市因其独特的地理和人口特征而呈现出不同的时空模式,这增加了数据处理的复杂性。其次,数据集包含了大量的原始信息,如包裹的定位和时间要求,以及任务事件信息,这些信息的整合和处理需要高效的数据管理技术。此外,数据集的多样性也带来了模型训练的挑战,如何在不同场景和城市间实现模型的泛化能力是一个重要的研究课题。
常用场景
经典使用场景
在物流与配送领域,LaDe-P数据集以其大规模和全面性成为研究热点。该数据集涵盖了从订单接受到包裹取件的完整流程,为学者们提供了丰富的时空信息。经典使用场景包括路径预测、预计到达时间(ETA)预测以及时空图预测。通过分析这些数据,研究人员能够优化配送路线,提高配送效率,并预测未来的配送需求。
解决学术问题
LaDe-P数据集解决了物流领域中多个关键的学术研究问题。首先,它为路径优化提供了详尽的数据支持,有助于开发更高效的配送算法。其次,通过分析时间窗口和GPS数据,该数据集能够帮助预测配送时间,从而提高客户满意度。此外,其时空图数据为城市级别的物流网络分析提供了新的视角,有助于理解城市物流的动态变化。
实际应用
在实际应用中,LaDe-P数据集已被广泛用于物流公司的运营优化。例如,通过分析历史数据,物流公司可以优化配送路线,减少配送时间和成本。此外,该数据集还被用于开发智能调度系统,通过实时分析配送员的位置和任务状态,提高配送效率。在城市规划中,该数据集也为物流基础设施的优化提供了数据支持。
数据集最近研究
最新研究方向
在物流与配送领域,LaDe-P数据集因其大规模、全面信息和多样性特征,成为研究热点。当前前沿研究方向主要集中在时空图预测、路径规划优化以及预计到达时间(ETA)预测。时空图预测通过分析城市间的独特时空模式,提升配送效率;路径规划优化则致力于通过机器学习算法,如LightGBM和DeepRoute,优化配送路径,减少配送时间和成本;ETA预测则通过精确的时间窗口管理,提高客户满意度。这些研究不仅推动了物流行业的智能化发展,也为城市交通管理提供了新的视角和解决方案。
以上内容由AI搜集并总结生成
