five

PEMS-SF|交通流量数据集|预测分析数据集

收藏
github2021-12-04 更新2024-05-31 收录
交通流量
预测分析
下载链接:
https://github.com/tami1082/Traffic-Public-Datasets
下载链接
链接失效反馈
资源简介:
PEMS-SF数据集包含交通流量数据,数据被聚合到5分钟间隔,意味着每小时有12个流量数据点。该数据集用于交通流量预测和分析。

The PEMS-SF dataset encompasses traffic flow data, aggregated into 5-minute intervals, implying 12 data points per hour. This dataset is utilized for traffic flow prediction and analysis.
创建时间:
2021-07-14
原始信息汇总

数据集概述

数据集列表

  • Los and sz, Pems3478, Pems7M, Pems-bay, metra-la, Pems-sf, Seattle_loop

数据集详细信息

  • Pems-SF

  • Pems-03

    • 数据聚合:每5分钟
    • 数据点:每小时12个点
  • Pems-04

    • 数据聚合:每5分钟
    • 数据点:每小时12个点
    • 包含:3848个检测器,29条道路
    • 时间范围:2018年1月至2月
    • 数据格式:每个npz文件包含一个名为"data"的键,形状为(sequence_length, num_of_vertices, num_of_features)
  • Pems-07

    • 数据聚合:每5分钟
    • 数据点:每小时12个点
    • 包含:两个csv文件,一个包含顶点间距离,另一个包含时间序列数据
  • Pems-07M

    • 数据来源:Caltrans Performance Measurement System (PeMS)
    • 数据聚合:每5分钟
    • 时间范围:2012年5月和6月的工作日
    • 数据选择:随机选择了District 7中的中等和大规模数据源,分别标记为PeMSD7(M)和PeMSD7(L)
  • Pems-08

    • 数据聚合:每5分钟
    • 数据点:每小时12个点
    • 包含:1979个检测器,8条道路
    • 时间范围:2016年7月至8月
    • 数据格式:每个npz文件包含一个名为"data"的键,形状为(sequence_length, num_of_vertices, num_of_features)
    • 交通测量:总流量、平均速度、平均占用率
  • BAY-METR-LA

    • METR-LA
      • 包含:207个传感器
      • 时间范围:2012年3月1日至6月30日
    • PEMS-BAY
      • 包含:325个传感器
      • 时间范围:2017年1月1日至5月31日
  • Los-loop-sz

    • Los
      • 包含:207个传感器
      • 时间范围:2012年3月1日至3月7日
      • 数据聚合:每5分钟
    • Sz
      • 时间范围:2015年1月1日至1月31日
      • 数据聚合:每15分钟
      • 包含:156条主要道路
  • Seattle_Loop_Dataset

AI搜集汇总
数据集介绍
main_image_url
构建方式
PEMS-SF数据集的构建基于加利福尼亚州高速公路系统的实时交通数据,通过超过39,000个传感器站收集。数据集的时间分辨率为5分钟,涵盖了多个主要大都市区域。具体而言,PEMS-SF数据集包含了从2012年5月至6月的历史速度记录,其中第一个月的数据被选为训练集,其余部分则分别用于验证和测试。
特点
PEMS-SF数据集的一个显著特点是其高时间分辨率和广泛的空间覆盖。数据集不仅包含了详细的交通流量信息,还提供了平均速度和平均占用率等多维度的交通测量数据。此外,数据集的预处理确保了相邻检测器之间的距离超过3.5英里,从而保证了数据的独立性和代表性。
使用方法
PEMS-SF数据集适用于多种交通预测和分析任务。用户可以通过访问提供的Google Drive链接下载数据集,并使用Python中的NumPy库加载.npz文件。每个文件包含一个名为'data'的键,其形状为(序列长度, 顶点数量, 特征数量)。数据集还提供了Colab版本,用户可以直接在Google Colab中运行和分析数据。
背景与挑战
背景概述
PEMS-SF数据集,全称为Performance Measurement System - San Francisco,是由加州交通局(Caltrans)的性能测量系统收集的时空数据集。该数据集主要用于研究旧金山地区的交通流量和速度,涵盖了多个传感器在不同时间点的数据。PEMS-SF数据集的创建旨在为交通管理和预测模型提供高质量的数据支持,特别是在交通流量预测和交通网络优化方面。通过提供详细的交通数据,该数据集为研究人员和工程师提供了一个宝贵的资源,以开发和验证新的交通管理策略和技术。
当前挑战
PEMS-SF数据集在构建和应用过程中面临多项挑战。首先,数据的高维性和复杂性使得数据预处理和特征提取变得尤为困难。其次,由于交通数据的实时性和动态性,如何有效地处理和分析大规模的时空数据是一个重要挑战。此外,数据集中的噪声和缺失值问题也需要通过先进的算法和技术来解决。最后,尽管PEMS-SF数据集提供了丰富的交通信息,但其应用仍需克服模型训练和预测精度方面的挑战,以确保其在实际交通管理中的有效性和可靠性。
常用场景
经典使用场景
PEMS-SF数据集在交通流量预测领域具有经典应用。该数据集通过收集和分析加利福尼亚州高速公路系统中的实时交通数据,为研究人员提供了一个详尽的时空数据资源。其经典使用场景包括但不限于交通流量预测模型的训练与验证,通过分析历史交通数据,模型能够预测未来交通流量的变化趋势,从而为交通管理和优化提供科学依据。
衍生相关工作
PEMS-SF数据集的发布催生了多项相关研究工作。例如,基于该数据集,研究者开发了多种交通流量预测模型,如深度学习模型和时空图卷积网络,这些模型在交通预测领域取得了显著成果。此外,PEMS-SF数据集还被用于研究交通数据的异常检测和模式识别,推动了交通数据分析技术的发展。在多源数据融合方面,PEMS-SF数据集与其他交通数据集的结合应用,也为跨领域研究提供了新的思路和方法。
数据集最近研究
最新研究方向
在智能交通领域,PEMS-SF数据集因其丰富的时空数据特性,成为研究交通流量预测和交通网络优化的重要资源。近年来,基于深度学习的时空数据分析方法在该数据集上取得了显著进展,尤其是在交通流量预测方面。研究者们利用卷积神经网络(CNN)和长短期记忆网络(LSTM)等模型,结合时空特征,提升了预测精度。此外,PEMS-SF数据集还被广泛应用于交通网络的动态优化研究中,通过分析历史数据和实时数据,优化交通信号控制和路径规划,从而提高交通系统的效率和安全性。这些研究不仅推动了智能交通系统的发展,也为城市交通管理提供了科学依据。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
5,000+
优质数据集
54 个
任务类型
进入经典数据集