five

Cainiao-AI/LaDe-P|快递物流数据集|时空数据分析数据集

收藏
hugging_face2023-06-22 更新2024-03-04 收录
快递物流
时空数据分析
下载链接:
https://hf-mirror.com/datasets/Cainiao-AI/LaDe-P
下载链接
链接失效反馈
资源简介:
LaDe是一个公开的最后一公里配送数据集,包含来自工业界的数百万个包裹。它具有三个独特特征:(1) 大规模:涉及6个月内21,000名配送员的10,677,000个包裹;(2) 信息全面:提供原始包裹信息(如位置和时间要求)以及任务事件信息(如任务接受和任务完成事件发生的时间和地点);(3) 多样性:数据集包括多种场景(如包裹取件和配送)和多个城市的数据,每个城市都有其独特的时空模式。

LaDe是一个公开的最后一公里配送数据集,包含来自工业界的数百万个包裹。它具有三个独特特征:(1) 大规模:涉及6个月内21,000名配送员的10,677,000个包裹;(2) 信息全面:提供原始包裹信息(如位置和时间要求)以及任务事件信息(如任务接受和任务完成事件发生的时间和地点);(3) 多样性:数据集包括多种场景(如包裹取件和配送)和多个城市的数据,每个城市都有其独特的时空模式。
提供机构:
Cainiao-AI
原始信息汇总

数据集概述

数据集名称: LaDe

许可证: Apache-2.0

标签:

  • Spatial-Temporal
  • Graph
  • Logistic

大小: 10M<n<100M

数据集特征

特征名称 数据类型
order_id int64
region_id int64
city string
courier_id int64
accept_time string
time_window_start string
time_window_end string
lng float64
lat float64
aoi_id int64
aoi_type int64
pickup_time string
pickup_gps_time string
pickup_gps_lng float64
pickup_gps_lat float64
accept_gps_time string
accept_gps_lng float64
accept_gps_lat float64
ds int64

数据集划分

划分名称 字节数 示例数
pickup_jl 54225579 261801
pickup_cq 243174931 1172703
pickup_yt 237146694 1146781
pickup_sh 293399390 1424406
pickup_hz 436103754 2130456

下载信息

下载大小: 443251368

数据集大小: 1264050348

数据集描述

LaDe是一个公开可用的最后一英里配送数据集,包含数百万个来自行业的包裹。该数据集具有大规模、信息全面和多样性的特点,涵盖了多种场景和多个城市,每个城市都有其独特的时空模式。

引用信息

若使用此数据集进行研究,请引用相关论文: {xxx}

AI搜集汇总
数据集介绍
main_image_url
构建方式
LaDe-P数据集的构建基于大规模的实际物流操作数据,涵盖了21,000名快递员在六个月内处理的10,677,000个包裹。数据集通过收集每个包裹的详细信息,包括地理位置、时间窗口要求以及任务事件信息,如实记录了快递员在任务接受和完成时的具体时间和地点。这些数据经过精细处理,以CSV格式呈现,便于后续分析和研究。
使用方法
LaDe-P数据集适用于多种研究场景,包括但不限于路线预测、预计到达时间预测和时空图预测。用户可以通过访问HuggingFace平台下载数据集,并按照提供的代码链接进行数据处理和分析。数据集的结构清晰,每个文件代表一个特定城市的数据,用户可以根据需要选择特定城市或全部数据进行研究。在使用前,请确保阅读并遵守相关的使用条款。
背景与挑战
背景概述
LaDe-P数据集是由Cainiao-AI团队公开发布的末端配送数据集,涵盖了从多个城市收集的数百万个包裹信息。该数据集的创建旨在为物流和配送领域的研究提供大规模、全面且多样化的数据支持。其核心研究问题包括优化配送路径、预测到达时间以及分析空间-时间图的动态变化。LaDe-P数据集的发布不仅为学术界提供了宝贵的资源,也为工业界提供了实际应用的参考,推动了物流和配送领域的技术进步。
当前挑战
LaDe-P数据集在构建过程中面临了多重挑战。首先,数据集涉及多个城市的复杂配送场景,每个城市因其独特的地理和人口特征而呈现出不同的时空模式,这增加了数据处理的复杂性。其次,数据集包含了大量的原始信息,如包裹的定位和时间要求,以及任务事件信息,这些信息的整合和处理需要高效的数据管理技术。此外,数据集的多样性也带来了模型训练的挑战,如何在不同场景和城市间实现模型的泛化能力是一个重要的研究课题。
常用场景
经典使用场景
在物流与配送领域,LaDe-P数据集以其大规模和全面性成为研究热点。该数据集涵盖了从订单接受到包裹取件的完整流程,为学者们提供了丰富的时空信息。经典使用场景包括路径预测、预计到达时间(ETA)预测以及时空图预测。通过分析这些数据,研究人员能够优化配送路线,提高配送效率,并预测未来的配送需求。
解决学术问题
LaDe-P数据集解决了物流领域中多个关键的学术研究问题。首先,它为路径优化提供了详尽的数据支持,有助于开发更高效的配送算法。其次,通过分析时间窗口和GPS数据,该数据集能够帮助预测配送时间,从而提高客户满意度。此外,其时空图数据为城市级别的物流网络分析提供了新的视角,有助于理解城市物流的动态变化。
实际应用
在实际应用中,LaDe-P数据集已被广泛用于物流公司的运营优化。例如,通过分析历史数据,物流公司可以优化配送路线,减少配送时间和成本。此外,该数据集还被用于开发智能调度系统,通过实时分析配送员的位置和任务状态,提高配送效率。在城市规划中,该数据集也为物流基础设施的优化提供了数据支持。
数据集最近研究
最新研究方向
在物流与配送领域,LaDe-P数据集因其大规模、全面信息和多样性特征,成为研究热点。当前前沿研究方向主要集中在时空图预测、路径规划优化以及预计到达时间(ETA)预测。时空图预测通过分析城市间的独特时空模式,提升配送效率;路径规划优化则致力于通过机器学习算法,如LightGBM和DeepRoute,优化配送路径,减少配送时间和成本;ETA预测则通过精确的时间窗口管理,提高客户满意度。这些研究不仅推动了物流行业的智能化发展,也为城市交通管理提供了新的视角和解决方案。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

UniProt

UniProt(Universal Protein Resource)是全球公认的蛋白质序列与功能信息权威数据库,由欧洲生物信息学研究所(EBI)、瑞士生物信息学研究所(SIB)和美国蛋白质信息资源中心(PIR)联合运营。该数据库以其广度和深度兼备的蛋白质信息资源闻名,整合了实验验证的高质量数据与大规模预测的自动注释内容,涵盖从分子序列、结构到功能的全面信息。UniProt核心包括注释详尽的UniProtKB知识库(分为人工校验的Swiss-Prot和自动生成的TrEMBL),以及支持高效序列聚类分析的UniRef和全局蛋白质序列归档的UniParc。其卓越的数据质量和多样化的检索工具,为基础研究和药物研发提供了无可替代的支持,成为生物学研究中不可或缺的资源。

www.uniprot.org 收录

中国裁判文书网

中国裁判文书网是中国最高人民法院设立的官方网站,旨在公开各级法院的裁判文书。该数据集包含了大量的法律文书,如判决书、裁定书、调解书等,涵盖了民事、刑事、行政、知识产权等多个法律领域。

wenshu.court.gov.cn 收录

猫狗图像数据集

该数据集包含猫和狗的图像,每类各12500张。训练集和测试集分别包含10000张和2500张图像,用于模型的训练和评估。

github 收录

MultiTalk

MultiTalk数据集是由韩国科学技术院创建,包含超过420小时的2D视频,涵盖20种不同语言,旨在解决多语言环境下3D说话头生成的问题。该数据集通过自动化管道从YouTube收集,每段视频都配有语言标签和伪转录,部分视频还包含伪3D网格顶点。数据集的创建过程包括视频收集、主动说话者验证和正面人脸验证,确保数据质量。MultiTalk数据集的应用领域主要集中在提升多语言3D说话头生成的准确性和表现力,通过引入语言特定风格嵌入,使模型能够捕捉每种语言独特的嘴部运动。

arXiv 收录

RAVDESS

情感语音和歌曲 (RAVDESS) 的Ryerson视听数据库包含7,356个文件 (总大小: 24.8 GB)。该数据库包含24位专业演员 (12位女性,12位男性),以中性的北美口音发声两个词汇匹配的陈述。言语包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶的表情,歌曲则包含平静、快乐、悲伤、愤怒和恐惧的情绪。每个表达都是在两个情绪强度水平 (正常,强烈) 下产生的,另外还有一个中性表达。所有条件都有三种模态格式: 纯音频 (16位,48kHz .wav),音频-视频 (720p H.264,AAC 48kHz,.mp4) 和仅视频 (无声音)。注意,Actor_18没有歌曲文件。

OpenDataLab 收录