GSP-Traffic Dataset
收藏github2024-05-16 更新2024-05-31 收录
下载链接:
https://github.com/rukumagai/GSP-Traffic-Dataset
下载链接
链接失效反馈官方服务:
资源简介:
GSP-Traffic数据集是一个大规模的时变图信号数据集,基于全球465个城市的模拟交通网络。数据集使用Simulation of Urban MObility(SUMO)模拟器生成,包含了真实的道路网络和通过交叉口的车辆总数。该数据集适用于图信号处理和图神经网络的性能比较分析。
The GSP-Traffic dataset is a large-scale time-varying graph signal dataset based on simulated traffic networks across 465 cities worldwide. Generated using the Simulation of Urban MObility (SUMO) simulator, the dataset encompasses authentic road networks and the total number of vehicles passing through intersections. It is suitable for performance comparison analysis in graph signal processing and graph neural networks.
创建时间:
2023-12-08
原始信息汇总
GSP-Traffic Dataset 概述
数据集描述
数据集来源与构成
- 名称:GSP-Traffic Dataset
- 作者:Rui Kumagai, Hayate Kojima, Hiroshi Higashi, Yuichi Tanaka
- 模拟工具:使用“Simulation of Urban MObility” (SUMO) 进行交通流量模拟
- 数据基础:基于全球465个城市的虚拟交通流量测量
- 图表示:城市道路网络,其中交叉点为顶点,道路为边
- 信号数据:通过SUMO模拟得到的通过交叉点的车辆总数
- 测量周期:500秒
- 模拟周期:50,000秒
数据集特性
- 图统计:
- 顶点数:最大1399,最小102,平均350.54,中位数306,标准差222.03
- 边数:最大1979,最小125,平均479.88,中位数426,标准差303.87,平均度数2.74
数据集结构
- 文件存储:每个城市的数据存储为
(country)_(city).mat - 数据变量:
N:节点数T:时间序列数L:图拉普拉斯矩阵W:加权矩阵data:时变图信号pos:节点位置(经度,纬度)
使用方法
- 安装:通过解压提供的包进行安装,需放置在
your_directory/gspbox/gsp_traffic路径下 - MATLAB命令:运行
Traffic_install设置必要路径
数据集应用
- 数据加载:通过指定城市和国家名称加载数据
- 数据可视化:绘制图和信号,支持时间变化:
t=1 - 信号滤波:进行简单的信号去噪实验,包括信号归一化、噪声添加和低通滤波器设计
引用信息
- 引用格式: bibtex @conference{gsp_traffic, title = {GSP-Traffic Dataset: Graph signal processing dataset based on traffic simulation}, author = {Kumagai, Rui and Kojima, Hayate and Higashi, Hiroshi and Tanaka, Yuichi}, booktitle = {Graph Signal Processing Workshop 2024, Delft, The Netherlands}, year = {2024}, month = {Jun}, }
数据集统计
图与信号特性
- 图表示:城市道路网络,交叉点为顶点,道路为边
- 信号数据:通过SUMO模拟得到的通过交叉点的车辆总数
- 测量周期:500秒
- 模拟周期:50,000秒
图统计数据
| 统计项 | 最大值 | 最小值 | 平均值 | 中位数 | 标准差 | 平均度数 |
|---|---|---|---|---|---|---|
| #vertex | 1399 | 102 | 350.54 | 306 | 222.03 | - |
| #edge | 1979 | 125 | 479.88 | 426 | 303.87 | 2.74 |
信号分布
- 平均信号值与标准差:在每个城市的GSP-Traffic Dataset中展示
- 对数能量分布:在图频域中的平均值和标准差展示
搜集汇总
数据集介绍

构建方式
GSP-Traffic Dataset通过模拟交通流量构建,利用了开源交通仿真工具SUMO和真实道路网络数据Open Street Map。该数据集涵盖了全球465个城市的道路网络,其中每个城市的道路网络被表示为一个图,节点为交叉口,边为道路。通过SUMO的长时间模拟(50,000秒),生成了每个交叉口的车辆通过量数据,形成时间变化图信号。
特点
该数据集的显著特点在于其大规模和真实性。它包含了465个城市的真实道路网络,每个网络的节点和边数量分布广泛,从最小的102个节点到最大的1399个节点不等。此外,数据集中的信号是基于实际交通模拟生成的,具有时间变化特性,适合用于图信号处理和图神经网络的性能比较研究。
使用方法
GSP-Traffic Dataset主要用于MATLAB环境下的图信号处理研究,推荐与GSP toolbox结合使用。用户可以通过指定城市和国家的名称来加载数据,并进行图的构建和信号的可视化。数据集还提供了用于信号滤波和噪声处理的示例代码,帮助用户进行信号处理实验。
背景与挑战
背景概述
图信号处理(GSP)与图神经网络(GNN)作为信号处理与机器学习领域的新兴研究方向,近年来备受关注。为量化比较这些方法的性能,可靠的包含图结构与图信号的数据集显得尤为重要。GSP-Traffic Dataset由Rui Kumagai、Hayate Kojima、Hiroshi Higashi和Yuichi Tanaka等研究人员于2024年提出,基于全球465个城市的虚拟交通流量测量数据构建。该数据集通过使用交通流模拟器SUMO,模拟了不同城市在一致条件下的交通流量,确保了数据的可靠性。图结构来源于Open Street Map的真实道路网络,信号则为通过SUMO模拟得到的车辆通过交叉口的数量。该数据集的创建旨在为图信号处理与图学习方法的定量分析提供支持,避免了对图结构的估计,从而提升了研究的准确性与可比性。
当前挑战
GSP-Traffic Dataset在构建过程中面临多重挑战。首先,如何通过SUMO模拟器在不同城市间保持一致的交通条件,以确保数据的可比性,是一个技术难题。其次,从Open Street Map获取的真实道路网络数据需要进行有效的预处理,以适应图信号处理的分析需求。此外,数据集的时间序列信号生成涉及大规模的模拟计算,如何在有限的计算资源下高效完成这一任务也是一大挑战。最后,该数据集的应用场景广泛,涵盖图信号处理与图神经网络的多个领域,如何在不同应用中保持数据的有效性与一致性,仍需进一步探索与优化。
常用场景
经典使用场景
GSP-Traffic Dataset 在交通网络分析领域具有广泛的应用前景。该数据集通过模拟全球465个城市的交通流量,提供了时间变化的图信号数据,特别适用于图信号处理(GSP)和图神经网络(GNN)的研究。研究者可以利用该数据集进行交通流量的预测、信号去噪、以及图结构的学习与优化,从而为城市交通管理提供科学的决策支持。
实际应用
在实际应用中,GSP-Traffic Dataset 可用于智能交通系统的开发与优化。例如,城市交通管理部门可以利用该数据集进行交通流量预测,从而实现动态交通信号控制,减少交通拥堵。此外,该数据集还可用于自动驾驶技术的测试与验证,通过模拟不同城市的交通环境,提升自动驾驶系统的适应性和安全性。
衍生相关工作
GSP-Traffic Dataset 的发布激发了大量相关研究工作。例如,研究者基于该数据集开发了新的图信号处理算法,用于交通流量的实时预测和优化。此外,该数据集还被用于图神经网络的训练与评估,推动了图神经网络在交通领域的应用。这些衍生工作不仅丰富了图信号处理的研究内容,还为智能交通系统的发展提供了技术支持。
以上内容由遇见数据集搜集并总结生成



