XXLTraffic
收藏arXiv2024-06-18 更新2024-06-20 收录
下载链接:
https://github.com/cruiseresearchgroup/XXLTraffic
下载链接
链接失效反馈官方服务:
资源简介:
XXLTraffic数据集是由新南威尔士大学创建,旨在解决智能交通系统中超动态和极长预测问题。该数据集包含长达23年的交通数据,涵盖9个区域,支持时间和空间上的扩展挑战。数据集通过加州交通部性能测量系统(PeMS)收集,包含详细的传感器数据和元数据。XXLTraffic不仅支持传统的时间序列预测,还引入了时间间隔和降采样设置,以模拟实际交通预测中的复杂情况。此数据集的应用领域广泛,特别是在城市基础设施规划和道路管理中,为长期交通预测提供了强大的数据支持。
The XXLTraffic dataset was developed by the University of New South Wales to tackle ultra-dynamic and extremely long-range prediction issues in intelligent transportation systems. This dataset holds 23 years of continuous traffic data spanning 9 regions, and supports extended challenges across both temporal and spatial dimensions. Collected via the Performance Measurement System (PeMS) of the California Department of Transportation, it includes detailed sensor data and metadata. Beyond supporting traditional time series forecasting, XXLTraffic also introduces temporal interval and downsampling settings to simulate the complex scenarios arising in real-world traffic prediction. This dataset has broad application scenarios, especially in urban infrastructure planning and road management, providing robust data support for long-term traffic forecasting.
提供机构:
新南威尔士大学
创建时间:
2024-06-18
搜集汇总
数据集介绍

构建方式
XXLTraffic数据集的构建基于加利福尼亚州交通部(CalTrans)的性能测量系统(PeMS),该系统通过分布在加州高速公路上的19,561个传感器收集交通数据。研究人员从2001年至2024年3月期间,下载了九个区域的原始数据,并进行了严格的数据过滤和聚合。为了支持极长预测任务,数据集特别选择了早期安装并持续收集数据的传感器子集,形成了包含时间间隔和空间节点扩展的交通数据。数据预处理包括每小时和每日的聚合,以支持不同时间尺度的预测任务。
特点
XXLTraffic数据集的特点在于其极长的时间跨度和不断扩展的空间节点。数据集涵盖了23年的时间跨度,并且随着时间的推移,传感器节点的数量不断增加,反映了真实世界中交通基础设施的动态变化。此外,数据集还包含了时间间隔和传感器数据缺失的情况,模拟了实际交通预测中的复杂场景。这些特点使得XXLTraffic能够支持极长预测任务,并为研究超动态交通预测提供了丰富的实验环境。
使用方法
XXLTraffic数据集的使用方法包括极长预测、小时级和日级预测任务。数据集提供了标准的时间序列预测设置,并引入了时间间隔和训练数据下采样的新配置,以更好地模拟实际约束。研究人员可以通过数据集中的时间间隔设置,探索极长预测任务中的时间分布变化。此外,数据集还支持零样本预测任务,允许研究人员在新增传感器上进行预测。数据集的使用不仅限于传统的交通预测模型,还可以为基于深度学习的时空模型提供新的研究方向。
背景与挑战
背景概述
XXLTraffic数据集由新南威尔士大学的研究团队于2024年提出,旨在解决交通预测领域中的超动态和超长期预测问题。该数据集是目前公开的最大交通数据集,涵盖了长达23年的时间跨度,并包含了逐年增加的传感器节点。XXLTraffic的创建背景源于现有交通数据集在反映真实世界超动态特性方面的局限性,如基础设施的持续演变、时间分布的变化以及传感器故障或交通模式变化导致的时间间隔。该数据集不仅支持传统的时间序列预测任务,还引入了时间间隔和训练数据下采样等新颖配置,以更好地模拟实际约束。XXLTraffic的发布为交通预测和时间序列分析领域提供了新的研究视角,并为开发应对超动态和超长期预测问题的模型提供了强大的平台。
当前挑战
XXLTraffic数据集在构建和应用过程中面临多重挑战。首先,交通预测领域本身具有高度复杂性,尤其是在超动态和超长期预测任务中,模型需要处理基础设施的持续演变、时间分布的变化以及传感器数据的不连续性。其次,数据集的构建过程中,研究人员需要应对传感器节点的逐年增加以及数据采集过程中的时间间隔问题,这要求对数据进行严格的筛选和聚合。此外,由于数据集的时间跨度长达23年,城市基础设施的发展和道路建设可能导致交通模式的显著变化,这种时间域的变化对模型的适应性提出了更高的要求。最后,XXLTraffic的庞大规模也对计算资源提出了更高的需求,尤其是在处理超长期预测任务时,模型的训练和推理过程需要更多的计算资源和时间。
常用场景
经典使用场景
XXLTraffic数据集在交通预测领域具有广泛的应用,尤其是在超动态和极长时间跨度的预测任务中。该数据集通过提供长达23年的交通数据,涵盖了多个传感器节点的增长和变化,能够支持从小时级到天级的多种时间尺度预测任务。其经典使用场景包括城市交通流量预测、高速公路规划以及智能交通系统的优化。通过引入时间间隔和训练数据下采样,XXLTraffic能够更好地模拟现实世界中的复杂交通动态,为研究者提供了一个强有力的工具来应对超动态预测挑战。
解决学术问题
XXLTraffic数据集解决了现有交通预测数据集中存在的多个学术问题。首先,它弥补了现有数据集在时间跨度和空间覆盖上的不足,提供了长达23年的数据,能够支持极长时间的预测任务。其次,该数据集通过引入时间间隔和传感器节点的动态增长,模拟了现实世界中交通基础设施的持续变化,帮助研究者更好地应对数据分布随时间变化的问题。此外,XXLTraffic还支持零样本预测任务,为处理新传感器数据的预测问题提供了新的研究方向。这些特性使得XXLTraffic成为交通预测领域的一个重要资源,推动了超动态预测模型的发展。
衍生相关工作
XXLTraffic数据集的发布催生了一系列相关研究工作。首先,基于该数据集的研究推动了超动态预测模型的发展,许多研究者提出了新的深度学习架构,如基于Transformer的变体和图神经网络(GNN),以应对极长时间跨度和动态变化的挑战。其次,XXLTraffic为零样本预测任务提供了新的研究方向,研究者们提出了多种迁移学习和持续学习框架,以处理新传感器数据的预测问题。此外,该数据集还激发了关于时间序列分解和多尺度预测的研究,许多工作探索了如何从极长时间序列中提取有效的时空模式。这些衍生工作不仅丰富了交通预测领域的研究内容,也为其他时间序列预测任务提供了新的思路。
以上内容由遇见数据集搜集并总结生成



