five

PeMS data-sets

收藏
github2024-05-07 更新2024-05-31 收录
下载链接:
https://github.com/SANDAG/PeMS-Datasets
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集来自Caltrans Performance Measurement System (PeMS),存储在PeMS Data Clearinghouse中,用于交通数据分析。数据集通过浏览器扩展批量下载,并加载到内部SQL服务器实例中进行进一步处理和汇总。

This dataset originates from the Caltrans Performance Measurement System (PeMS) and is stored in the PeMS Data Clearinghouse, utilized for traffic data analysis. The dataset is downloaded in bulk via a browser extension and subsequently loaded into an internal SQL server instance for further processing and aggregation.
创建时间:
2020-02-07
原始信息汇总

PeMS-Datasets 数据集概述

数据来源与获取

  • 数据集来自 Caltrans Performance Measurement System (PeMS) 的 Data Clearinghouse,网址为 http://pems.dot.ca.gov/。
  • 访问数据集需要创建用户名和密码。
  • 推荐使用批量下载器浏览器扩展下载数据集,因 Caltrans 限制使用程序化工具访问数据集。

数据加载

  • 数据集最终存储于内部 SQL 服务器实例,具体配置见项目 Python 文件夹中的 main.py 文件。
  • 下载后的数据集需放置于项目数据文件夹,并确保 PeMS SQL 对象(由 pemsObjects.sql 文件创建)存在于目标数据库中。
  • 使用提供的 environment.yml 文件创建 Python 解释器,并运行 main.py 文件以加载数据集至 SQL 数据库。

数据集总结

  • 数据库中的存储过程提供用户指定时间分辨率的 PeMS 数据集年度聚合,详细信息可参考 GitHub Wiki 页面。

匹配 PeMS 站点与 SANDAG 高速公路网络

  • 项目中的 Python 微服务(位于 matching 文件夹)用于匹配 PeMS 站点元数据与 SANDAG 高速公路网络文件。
  • 该脚本可独立运行,并使用单独的 environment.yml 文件。
搜集汇总
数据集介绍
main_image_url
构建方式
PeMS数据集的构建始于从Caltrans Performance Measurement System (PeMS)数据清仓库中获取原始数据。用户需通过创建用户名和密码访问http://pems.dot.ca.gov/。为避免程序化工具的限制,推荐使用批量下载浏览器扩展进行数据下载。下载后,需确保无重复或空文件。数据最终加载至项目Python文件夹中的main.py指定的内部SQL服务器实例。通过运行pemsObjects.sql文件,确保目标数据库中存在所有PeMS相关的SQL对象。随后,使用提供的environment.yml文件创建Python解释器,并运行main.py文件,实现从数据文件夹中提取必要的txt文件并加载至指定SQL数据库。
特点
PeMS数据集的核心特点在于其来源于Caltrans的性能测量系统,确保了数据的权威性和准确性。数据集包含详细的交通流量信息,覆盖了加利福尼亚州的多个交通站点。此外,数据集支持用户指定的年度聚合和时间分辨率,提供了灵活的数据分析选项。通过Python微服务,数据集还能与SANDAG高速公路网络进行匹配,增强了其在交通网络分析中的应用潜力。
使用方法
使用PeMS数据集时,首先需通过批量下载工具获取数据,并确保数据文件的完整性。随后,将数据放置于项目的数据文件夹中,并通过运行pemsObjects.sql文件在目标数据库中创建或更新PeMS相关的SQL对象。接着,使用environment.yml文件配置Python环境,并运行main.py文件,自动提取并加载数据至SQL数据库。对于数据汇总,数据库中的存储过程提供了年度聚合功能。此外,Python微服务可用于将PeMS站点元数据与SANDAG高速公路网络进行匹配,进一步扩展数据集的应用范围。
背景与挑战
背景概述
PeMS数据集是由加州交通部(Caltrans)的性能测量系统(PeMS)提供的交通数据集,主要用于存储、加载和汇总加州交通网络的性能数据。该数据集的创建旨在通过提供详细的交通流量和性能指标,支持交通管理和规划领域的研究与应用。PeMS数据集的获取需通过PeMS数据清算所,用户需注册账户并使用批量下载工具进行数据下载。该数据集的核心研究问题涉及交通流量的实时监控与分析,对提升交通系统的效率和安全性具有重要意义。
当前挑战
PeMS数据集在构建和使用过程中面临多项挑战。首先,数据获取过程中,由于Caltrans限制了编程工具的访问权限,用户需依赖批量下载浏览器扩展,这增加了数据获取的复杂性。其次,数据集中的重复文件和空文件问题较为常见,需用户在下载后进行清理。此外,数据加载到SQL服务器实例的过程需要确保SQL对象的正确创建和Python环境的配置,这要求用户具备一定的技术能力。最后,数据集的汇总和匹配过程依赖于特定的存储过程和Python微服务,这增加了数据处理的复杂性和技术门槛。
常用场景
经典使用场景
PeMS数据集在交通流量分析和预测中具有经典应用。通过整合来自加州交通性能测量系统(PeMS)的数据,研究者能够深入分析特定路段的交通流量模式,从而为交通管理和优化提供科学依据。该数据集支持时间序列分析,帮助识别交通高峰时段和低谷时段,为智能交通系统的规划和实施提供数据支持。
衍生相关工作
基于PeMS数据集,研究者们开发了多种交通流量预测和分析工具。例如,一些研究团队利用该数据集开发了基于机器学习的交通流量预测模型,显著提高了预测精度。此外,PeMS数据集还被用于研究交通网络的动态变化和交通事件的影响分析,推动了交通工程和智能交通系统领域的进一步发展。
数据集最近研究
最新研究方向
在交通管理与智能交通系统领域,PeMS数据集的最新研究方向主要集中在数据的高效处理与分析上。研究者们致力于开发更优化的数据加载和存储方案,以应对大规模交通数据的实时处理需求。此外,通过结合机器学习和深度学习技术,研究人员正在探索如何从PeMS数据中提取有价值的交通模式和趋势,以支持智能交通系统的决策制定。这些研究不仅提升了数据处理的效率,也为交通管理和城市规划提供了科学依据,推动了智能交通系统的发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作