Cainiao-AI/LaDe-P|快递物流数据集|时空数据分析数据集

hugging_face2023-06-22 更新2024-03-04 收录

快递物流

时空数据分析

下载链接：

https://hf-mirror.com/datasets/Cainiao-AI/LaDe-P

下载链接

链接失效反馈

资源简介：

LaDe是一个公开的最后一公里配送数据集，包含来自工业界的数百万个包裹。它具有三个独特特征：(1) 大规模：涉及6个月内21,000名配送员的10,677,000个包裹；(2) 信息全面：提供原始包裹信息（如位置和时间要求）以及任务事件信息（如任务接受和任务完成事件发生的时间和地点）；(3) 多样性：数据集包括多种场景（如包裹取件和配送）和多个城市的数据，每个城市都有其独特的时空模式。

提供机构：

Cainiao-AI

原始信息汇总

数据集概述

数据集名称: LaDe

许可证: Apache-2.0

标签:

Spatial-Temporal
Graph
Logistic

大小: 10M<n<100M

数据集特征

特征名称	数据类型
order_id	int64
region_id	int64
city	string
courier_id	int64
accept_time	string
time_window_start	string
time_window_end	string
lng	float64
lat	float64
aoi_id	int64
aoi_type	int64
pickup_time	string
pickup_gps_time	string
pickup_gps_lng	float64
pickup_gps_lat	float64
accept_gps_time	string
accept_gps_lng	float64
accept_gps_lat	float64
ds	int64

数据集划分

划分名称	字节数	示例数
pickup_jl	54225579	261801
pickup_cq	243174931	1172703
pickup_yt	237146694	1146781
pickup_sh	293399390	1424406
pickup_hz	436103754	2130456

下载信息

下载大小: 443251368

数据集大小: 1264050348

数据集描述

LaDe是一个公开可用的最后一英里配送数据集，包含数百万个来自行业的包裹。该数据集具有大规模、信息全面和多样性的特点，涵盖了多种场景和多个城市，每个城市都有其独特的时空模式。

引用信息

若使用此数据集进行研究，请引用相关论文: {xxx}

AI搜集汇总

数据集介绍

构建方式

LaDe-P数据集的构建基于大规模的实际物流操作数据，涵盖了21,000名快递员在六个月内处理的10,677,000个包裹。数据集通过收集每个包裹的详细信息，包括地理位置、时间窗口要求以及任务事件信息，如实记录了快递员在任务接受和完成时的具体时间和地点。这些数据经过精细处理，以CSV格式呈现，便于后续分析和研究。

使用方法

LaDe-P数据集适用于多种研究场景，包括但不限于路线预测、预计到达时间预测和时空图预测。用户可以通过访问HuggingFace平台下载数据集，并按照提供的代码链接进行数据处理和分析。数据集的结构清晰，每个文件代表一个特定城市的数据，用户可以根据需要选择特定城市或全部数据进行研究。在使用前，请确保阅读并遵守相关的使用条款。

背景与挑战

背景概述

LaDe-P数据集是由Cainiao-AI团队公开发布的末端配送数据集，涵盖了从多个城市收集的数百万个包裹信息。该数据集的创建旨在为物流和配送领域的研究提供大规模、全面且多样化的数据支持。其核心研究问题包括优化配送路径、预测到达时间以及分析空间-时间图的动态变化。LaDe-P数据集的发布不仅为学术界提供了宝贵的资源，也为工业界提供了实际应用的参考，推动了物流和配送领域的技术进步。

当前挑战

LaDe-P数据集在构建过程中面临了多重挑战。首先，数据集涉及多个城市的复杂配送场景，每个城市因其独特的地理和人口特征而呈现出不同的时空模式，这增加了数据处理的复杂性。其次，数据集包含了大量的原始信息，如包裹的定位和时间要求，以及任务事件信息，这些信息的整合和处理需要高效的数据管理技术。此外，数据集的多样性也带来了模型训练的挑战，如何在不同场景和城市间实现模型的泛化能力是一个重要的研究课题。

常用场景

经典使用场景

在物流与配送领域，LaDe-P数据集以其大规模和全面性成为研究热点。该数据集涵盖了从订单接受到包裹取件的完整流程，为学者们提供了丰富的时空信息。经典使用场景包括路径预测、预计到达时间（ETA）预测以及时空图预测。通过分析这些数据，研究人员能够优化配送路线，提高配送效率，并预测未来的配送需求。

解决学术问题

LaDe-P数据集解决了物流领域中多个关键的学术研究问题。首先，它为路径优化提供了详尽的数据支持，有助于开发更高效的配送算法。其次，通过分析时间窗口和GPS数据，该数据集能够帮助预测配送时间，从而提高客户满意度。此外，其时空图数据为城市级别的物流网络分析提供了新的视角，有助于理解城市物流的动态变化。

实际应用

在实际应用中，LaDe-P数据集已被广泛用于物流公司的运营优化。例如，通过分析历史数据，物流公司可以优化配送路线，减少配送时间和成本。此外，该数据集还被用于开发智能调度系统，通过实时分析配送员的位置和任务状态，提高配送效率。在城市规划中，该数据集也为物流基础设施的优化提供了数据支持。

数据集最近研究