MegaTrafficST
收藏github2026-01-26 更新2026-01-27 收录
下载链接:
https://github.com/williamZQ/MegaTrafficSTBenchmark
下载链接
链接失效反馈官方服务:
资源简介:
MegaTrafficST是一个大规模的交通时空基准数据集,包含19,584个节点和350,655条边,覆盖了美国加利福尼亚州的整个高速公路网络。该数据集提供了2025年3月连续一个月的交通流量、速度和占用率三种时间序列数据,以及多维空间属性。此外,数据集还提供了五个维度的多级分类子集(道路类型、城市、县、区域和行政区划),并附有丰富的空间分布可视化和基准模型代码。实验证明,MegaTrafficST能有效支持大规模交通预测模型的训练和评估,为复杂的时空交通研究提供了高质量、多粒度的数据基础。
MegaTrafficST is a large-scale spatiotemporal benchmark dataset for traffic studies. It comprises 19,584 nodes and 350,655 edges, covering the entire highway network of California, United States. This dataset provides three types of time-series data—traffic flow, speed, and occupancy—spanning a continuous month in March 2025, along with multi-dimensional spatial attributes. Additionally, it offers multi-level classification subsets across five dimensions: road type, city, county, region, and administrative division, accompanied by rich spatial distribution visualizations and baseline model code. Experiments have validated that MegaTrafficST can effectively support the training and evaluation of large-scale traffic prediction models, serving as a high-quality, multi-granularity data foundation for complex spatiotemporal traffic research.
创建时间:
2026-01-24
原始信息汇总
MegaTrafficST数据集概述
数据集简介
MegaTrafficST是一个大规模的交通时空基准数据集,旨在为智能交通系统(ITS)的研究提供高质量、大规模、多源、异质的时空交通数据基础,以支持复杂的时空依赖建模和超大规模路网评估。
核心构成
- 路网规模:包含19,584个节点和350,655条边。
- 地理覆盖:覆盖美国加利福尼亚州的整个高速公路网络。
- 地理坐标范围:纬度32.544°至39.790°,经度-123.030°至-114.560°。
数据类型与时间范围
- 时间序列数据类型:提供交通流量、速度和占有率三种类型的数据。
- 数据时间跨度:2025年3月连续一个月的数据。
- 空间属性:包含多维空间属性。
多级分类体系
数据集提供了跨五个维度的多级分类子集,具体如下:
| 主类别 | 子类别数量 | 节点总数 | 地理范围(纬度) | 地理范围(经度) |
|---|---|---|---|---|
| fwy | 224 | 19,584 | 32.544°-39.790° | -123.030°--114.560° |
| district | 9 | 19,584 | 32.544°-39.790° | -123.030°--114.560° |
| county | 43 | 19,584 | 32.544°-39.790° | -123.030°--114.560° |
| Line Type | 7 | 19,584 | 32.544°-39.790° | -123.030°--114.560° |
| City | 263 | 13,788 | 32.544°-39.760° | -123.015°--116.172° |
附加资源
- 可视化:提供丰富的空间分布可视化。
- 基准模型代码:提供用于训练和评估的基准模型代码。
- 数据下载:数据集开源下载地址为 https://pems.ubinet.cn/,无需密码即可下载全部数据。
实验支持
实验表明,该数据集能有效支持大规模交通预测模型的训练和评估,为复杂的时空交通研究提供了高质量、多粒度的数据基础。
搜集汇总
数据集介绍

构建方式
在智能交通系统研究领域,高质量、大规模时空数据的匮乏长期制约着复杂交通流建模与超大规模路网评估的发展。MegaTrafficST数据集通过系统整合美国加利福尼亚州全域高速公路网络的多源异构数据,构建了一个覆盖19,584个节点与350,655条边的大规模基准数据集。其构建过程严谨采集了2025年3月连续一个月的时序数据,包括交通流量、速度与占有率三类核心指标,并融合了多维空间属性。数据采集依托先进的传感网络与基础设施,确保了时空维度的高精度对齐与完整性,为后续的模型训练提供了可靠的数据基础。
特点
该数据集的核心特点体现在其前所未有的规模与精细的多层次结构上。它不仅涵盖了加州全境高速公路网络,还提供了按道路类型、城市、县、区域及行政区划划分的五维分类子集,共计包含数百个子类别。这种多粒度架构使得研究者能够针对不同空间尺度与行政单元开展定制化分析。数据集同时附有丰富的空间分布可视化图表与基准模型代码,极大便利了大规模交通预测模型的训练与评估工作,为复杂时空依赖关系的建模提供了立体化的数据支撑。
使用方法
为便于学术研究与应用开发,数据集已通过公开平台提供完整下载,无需任何访问密码。使用者可首先配置指定的Python 3.11环境,并通过提供的requirements文件安装依赖库。模型训练与评估可通过执行main.py与test_model.py脚本直接启动。该数据集设计支持端到端的实验流程,研究人员既可利用其多级分类子集进行特定区域的深入分析,也可基于全量数据训练面向超大规模路网的时空预测模型,从而推动智能交通系统前沿算法的创新与性能基准的建立。
背景与挑战
背景概述
随着城市化进程的加速和机动车保有量的持续增长,交通拥堵与环境污染等问题日益凸显,智能交通系统作为提升交通效率与安全性的关键技术应运而生。其有效运行依赖于高质量、大规模、多源异构的时空交通数据。然而,现有公开数据集在规模、数据类型及空间覆盖范围上存在局限,难以支撑复杂的时空依赖建模与超大规模路网评估。为此,MegaTrafficST数据集于2025年由相关研究团队构建,覆盖美国加利福尼亚州全境高速公路网络,包含19,584个节点与350,655条边,提供连续一个月的交通流量、速度及占有率三类时序数据,并附有多维空间属性。该数据集通过多级分类子集与丰富可视化资源,为大规模交通预测模型的训练与评估提供了高质量、多粒度的数据基础,显著推动了时空交通研究领域的发展。
当前挑战
在智能交通领域,精准预测大规模路网中的交通状态是一项核心挑战,涉及复杂的时空依赖关系建模,如长距离空间关联与动态时间模式捕捉。MegaTrafficST旨在解决超大规模路网下的交通预测问题,其构建过程面临多重困难:数据采集需整合多源异构传感器信息,确保时序一致性与空间完整性;处理海量节点与边的关系时,需设计高效存储与索引结构以支持快速访问;此外,数据标注与多级分类体系的建立要求精细的地理信息融合与质量控制,以保障数据在不同粒度研究中的可用性与可靠性。
常用场景
经典使用场景
在智能交通系统研究领域,MegaTrafficST数据集为大规模交通时空预测模型的训练与评估提供了经典范例。该数据集覆盖美国加州全境高速公路网络,包含近两万个节点与超过三十五万条边,并整合了连续一个月的交通流量、速度与占有率时间序列数据。研究者可借助其多维空间属性与多级分类子集,深入探究复杂路网中交通流的时空演化规律,从而优化交通状态预测的精度与鲁棒性。
解决学术问题
MegaTrafficST有效应对了现有公开数据集在规模、类型与空间覆盖上的局限,为超大规模路网评估与复杂时空依赖建模提供了高质量数据基础。该数据集支持研究者解决交通预测中长时依赖捕捉、多源异构数据融合以及跨区域泛化能力等核心学术问题,推动了时空图神经网络与交通动力学理论的交叉融合,显著提升了大规模交通系统建模的科学性与实用性。
衍生相关工作
依托MegaTrafficST丰富的时空属性与多级分类体系,已衍生出一系列经典研究工作。这些工作主要集中在时空图卷积网络的架构创新、多任务交通预测框架设计以及跨域迁移学习方法的探索上。部分研究进一步利用其细粒度区域划分数据,开发了面向特定城市或公路类型的个性化预测模型,推动了智能交通领域算法研究与工程实践的协同发展。
以上内容由遇见数据集搜集并总结生成



