Urban Traffic Speed Dataset of Guangzhou, China
收藏github2024-03-12 更新2024-05-31 收录
下载链接:
https://github.com/sysuits/urban-traffic-speed-dataset-Guangzhou
下载链接
链接失效反馈官方服务:
资源简介:
这是一个城市交通速度数据集,包含214个匿名道路段在两个月(即2016年8月1日至9月30日)内每10分钟间隔的速度观测数据,数据收集于中国广州。
This is an urban traffic speed dataset, comprising speed observation data collected at 10-minute intervals over a two-month period (from August 1 to September 30, 2016) for 214 anonymous road segments in Guangzhou, China.
创建时间:
2018-01-26
原始信息汇总
Urban Traffic Speed Dataset of Guangzhou, China
数据描述
- 时间范围:2016年8月1日至2016年9月30日
- 采样频率:每10分钟
- 道路段数:214个匿名道路段
- 数据量:1,855,589次速度观测
文件描述
-
speeddata.csv
- 数据量:包含1,855,589次速度观测
- 分割文件:分为speeddata_Aug.csv和speeddata_Sep.csv,分别对应8月和9月的数据
- 字段说明:
- road_id:道路段唯一标识
- day_id:日期唯一代码
- time_id:时间窗口唯一代码
- speed:速度值,单位为km/h
-
tensor.mat
- 数据结构:三阶张量
- 维度说明:
- 第一维度长度为214,对应道路段
- 第二维度长度为61,对应日期
- 第三维度长度为144,对应时间窗口
- 数据特性:
- 非零元素数量为1,855,589
- 总元素数量为1,879,776
- 缺失率为1.29%
出版物
- 论文标题:Spatial-temporal traffic speed patterns discovery and incomplete data recovery via SVD-combined tensor decomposition
- 作者:Xinyu Chen, Zhaocheng He, Jiawei Wang
- 发表年份:2018
- 期刊:Transportation Research Part C: Emerging Technologies
- 卷/期:86
- 页码:59-77
搜集汇总
数据集介绍

构建方式
该数据集通过在广州市内214个匿名路段上,从2016年8月1日至9月30日,每10分钟收集一次交通速度数据构建而成。数据采集频率确保了时间维度上的高分辨率,而路段的匿名化处理则保护了地理信息的隐私。数据集最终以CSV格式和MATLAB的第三阶张量格式存储,分别便于不同分析需求的直接使用。
特点
该数据集的显著特点在于其高频率的时间采样和广泛的空间覆盖,涵盖了广州市内214个路段的交通速度数据。此外,数据集通过将原始数据分割为两个文件(分别对应8月和9月的数据),提高了数据管理的效率。张量格式的数据存储方式,不仅减少了数据缺失率,还为高级数据分析提供了便利。
使用方法
用户可以通过加载CSV文件或MATLAB张量文件直接使用该数据集。CSV文件适合进行基础的统计分析和数据可视化,而MATLAB张量文件则适用于需要进行复杂空间-时间数据分析的研究。数据集的详细字段包括路段ID、日期ID、时间ID和速度值,这些字段为交通流量预测、模式识别等应用提供了丰富的信息基础。
背景与挑战
背景概述
城市交通速度数据集(Urban Traffic Speed Dataset of Guangzhou, China)是由Xinyu Chen、Zhaocheng He和Jiawei Wang等研究人员于2016年8月至9月在广州收集的,旨在探索和分析城市交通速度的时空模式。该数据集包含了214个匿名路段在两个月内的交通速度观测值,采样间隔为10分钟,共计1,855,589条记录。这一数据集的创建不仅为城市交通管理和优化提供了宝贵的数据支持,还为相关领域的研究,如交通流量预测、交通拥堵分析等,奠定了坚实的基础。
当前挑战
该数据集在构建过程中面临的主要挑战包括数据的高维性和时空复杂性。首先,数据集涉及214个路段、61天和144个时间窗口,形成了庞大的三阶张量结构,这增加了数据处理的复杂性。其次,数据中存在1.29%的缺失率,如何有效填补这些缺失值以确保分析的准确性是一个重要问题。此外,如何在保持数据完整性的同时,高效地进行数据降维和特征提取,也是该数据集在实际应用中需要解决的难题。
常用场景
经典使用场景
在城市交通管理领域,广州城市交通速度数据集以其详尽的交通速度观测数据,成为研究城市交通流量动态变化的经典工具。该数据集通过214个匿名路段在两个月内的10分钟间隔速度观测,为交通流量预测、拥堵模式识别以及交通管理策略优化提供了丰富的数据支持。
实际应用
在实际应用中,广州城市交通速度数据集被广泛用于智能交通系统(ITS)的开发与优化。通过分析历史交通速度数据,城市规划者和交通管理者能够制定更为精准的交通疏导策略,有效缓解城市交通拥堵,提升公共交通效率,从而改善市民的出行体验。
衍生相关工作
基于广州城市交通速度数据集,研究者们进一步开展了多项相关工作,如交通速度预测模型的优化、交通拥堵模式的深度学习分析等。这些研究不仅推动了交通数据科学的发展,也为其他城市交通数据集的应用提供了宝贵的经验和方法论。
以上内容由遇见数据集搜集并总结生成



