five

Cainiao-AI/LaDe-D|最后一公里配送数据集|物流数据分析数据集

收藏
hugging_face2023-06-22 更新2024-03-04 收录
最后一公里配送
物流数据分析
下载链接:
https://hf-mirror.com/datasets/Cainiao-AI/LaDe-D
下载链接
链接失效反馈
资源简介:
LaDe是一个公开的最后一公里配送数据集,包含来自工业界的数百万个包裹。该数据集具有三个独特特点:(1) 大规模:涉及21,000名快递员在6个月内的10,677,000个包裹。(2) 信息全面:提供原始包裹信息,如位置和时间要求,以及任务事件信息,记录快递员在任务接受和完成时的位置和时间。(3) 多样性:数据集包括来自多个城市的包裹取件和配送数据,每个城市都有其独特的时空模式。

LaDe是一个公开的最后一公里配送数据集,包含来自工业界的数百万个包裹。该数据集具有三个独特特点:(1) 大规模:涉及21,000名快递员在6个月内的10,677,000个包裹。(2) 信息全面:提供原始包裹信息,如位置和时间要求,以及任务事件信息,记录快递员在任务接受和完成时的位置和时间。(3) 多样性:数据集包括来自多个城市的包裹取件和配送数据,每个城市都有其独特的时空模式。
提供机构:
Cainiao-AI
原始信息汇总

数据集概述

数据集名称: LaDe

许可证: Apache-2.0

标签:

  • Spatial-Temporal
  • Graph
  • Logistic
  • Last-mile Delivery

大小分类: 10M<n<100M

数据集特征

特征名称 数据类型
order_id int64
region_id int64
city string
courier_id int64
lng float64
lat float64
aoi_id int64
aoi_type int64
accept_time string
accept_gps_time string
accept_gps_lng float64
accept_gps_lat float64
delivery_time string
delivery_gps_time string
delivery_gps_lng float64
delivery_gps_lat float64
ds int64

数据集分割

分割名称 字节数 示例数
delivery_jl 5568309 31415
delivery_cq 168574531 931351
delivery_yt 36796326 206431
delivery_sh 267095520 1483864
delivery_hz 335088000 1861600

数据集下载信息

  • 下载大小: 290229555 字节
  • 数据集大小: 813122686 字节

数据集描述

LaDe 是一个公开的最后一公里配送数据集,包含数百万个来自行业的包裹数据。该数据集具有以下特点:

  1. 大规模: 涉及10,677k个包裹和21k名快递员,覆盖6个月的实际运营数据。
  2. 信息全面: 提供原始包裹信息,如位置和时间要求,以及任务事件信息,记录快递员在任务接受和完成事件发生时的时间和地点。
  3. 多样性: 数据集包含多种场景的数据,如包裹取件和配送,以及多个城市,每个城市都有其独特的时空模式。

数据集使用

使用此数据集进行研究时,请引用相关论文:{xxx}

AI搜集汇总
数据集介绍
main_image_url
构建方式
LaDe-D数据集的构建基于大规模的末端配送数据,涵盖了21,000名快递员在六个月内的实际操作记录。数据集通过收集每个包裹的详细信息,包括其地理位置和时间要求,以及任务事件信息,记录了快递员在任务接受和完成时的具体时间和地点。这些数据来源于多个城市,确保了数据的多场景和多城市特性,从而提供了丰富的时空模式分析基础。
特点
LaDe-D数据集的显著特点在于其大规模、全面性和多样性。首先,数据集包含超过1000万条包裹记录,涉及多个城市的实际配送情况。其次,数据集提供了详细的包裹信息、快递员信息以及任务事件信息,为研究提供了丰富的数据支持。最后,数据集的多样性体现在其涵盖了不同城市和不同配送场景,每个城市因其独特的时空特征而呈现出不同的配送模式。
使用方法
LaDe-D数据集适用于多种研究目的,特别是针对末端配送优化、路径预测和时空图预测等领域的研究。用户可以通过下载CSV格式的数据文件,并按照提供的代码链接进行数据处理和分析。数据集的结构清晰,每个文件代表一个特定城市的配送数据,用户可以根据需要选择特定的城市数据进行分析。此外,数据集还提供了详细的字段描述,帮助用户更好地理解和使用数据。
背景与挑战
背景概述
LaDe-D数据集是由Cainiao-AI团队公开发布的末端配送数据集,涵盖了数百万个来自实际运营的包裹数据。该数据集的创建旨在为研究末端配送领域的学者和从业者提供一个大规模、信息全面且多样化的数据资源。LaDe-D数据集包含了21,000名快递员在六个月内的操作数据,涉及10,677,000个包裹,涵盖了多个城市的不同配送场景。其独特之处在于不仅提供了包裹的基本信息,如位置和时间要求,还记录了快递员在任务接受和完成时的详细事件信息,为研究末端配送的时空模式提供了丰富的数据支持。
当前挑战
LaDe-D数据集在构建过程中面临了多个挑战。首先,数据集的规模庞大,涉及数百万个包裹和数千名快递员,这要求在数据收集和处理过程中具备高效的数据管理能力。其次,数据集包含了多个城市的配送数据,每个城市因其独特的地理和人口特征而呈现出不同的时空模式,这增加了数据分析的复杂性。此外,数据集中的信息全面且详细,包括包裹信息、快递员信息和任务事件信息,如何在保证数据质量的同时进行有效的数据整合和清洗也是一个重要挑战。最后,数据集的多样性要求研究者在分析时考虑到不同场景和城市的特殊性,这为模型的泛化能力提出了更高的要求。
常用场景
经典使用场景
在物流与配送领域,LaDe-D数据集以其大规模和全面性成为研究热点。该数据集涵盖了从订单接收到配送完成的完整流程,为研究人员提供了丰富的时空信息。经典使用场景包括路径预测、预计到达时间(ETA)预测以及时空图预测。通过分析这些数据,研究人员能够优化配送路线,提高配送效率,并预测配送过程中的潜在问题。
衍生相关工作
基于LaDe-D数据集,研究者们开展了多项经典工作。例如,通过时空图预测模型,研究人员能够更准确地预测配送过程中的交通状况,从而优化配送策略。此外,路径预测和ETA预测模型的发展,也为物流企业的运营决策提供了科学依据。这些衍生工作不仅推动了物流与配送领域的技术进步,还为其他相关领域的研究提供了新的思路和方法。
数据集最近研究
最新研究方向
在物流与配送领域,LaDe-D数据集的最新研究方向主要集中在时空图预测和路径优化上。随着城市化进程的加速,末端配送的效率和准确性成为研究热点。研究者们通过构建复杂的时空图模型,分析配送过程中的动态变化,以提高路径规划的精度和实时性。此外,基于深度学习的ETA(Estimated Time of Arrival)预测模型也备受关注,通过融合多源数据,提升配送时间的预测准确度,从而优化整体配送流程。这些研究不仅推动了物流行业的智能化发展,也为城市交通管理提供了新的视角和方法。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

Wind Turbine Data

该数据集包含风力涡轮机的运行数据,包括风速、风向、发电量等参数。数据记录了多个风力涡轮机在不同时间点的运行状态,适用于风能研究和风力发电系统的优化分析。

www.kaggle.com 收录

中国区域交通网络数据集

该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。

data.stats.gov.cn 收录

CE-CSL

CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。

arXiv 收录

INTERACTION Dataset

INTERACTION数据集是由加州大学伯克利分校机械系统控制实验室等多个国际研究机构合作创建的,旨在为自动驾驶领域提供高质量的交互式驾驶场景数据。该数据集包含多种复杂的交互式驾驶场景,如城市/高速公路/匝道合并和车道变更、环形交叉口、信号交叉口等,覆盖多个国家和文化背景,以自然方式包含不同文化的驾驶偏好和风格。数据集强调高度交互和复杂的驾驶行为,包括对抗性和合作性运动,以及从常规安全操作到危险、接近碰撞的操纵。此外,数据集提供完整的语义地图信息,包括物理层、参考线、车道连接和交通规则,记录自无人机和交通摄像头。该数据集适用于运动预测、模仿学习、决策制定和规划、表示学习、交互提取和社会行为生成等研究领域,旨在解决自动驾驶中的关键问题。

arXiv 收录

LIDC-IDRI

LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。

OpenDataLab 收录