NE-BJ

Name: NE-BJ
Creator: 清华大学信息科学与技术国家研究中心
Published: 2021-05-03 22:11:25
License: 暂无描述

arXiv2021-05-03 更新2024-06-21 收录

下载链接：

https://github.com/tsinghua-fib-lab/Traffic-Benchmark

下载链接

链接失效反馈

官方服务：

资源简介：

NE-BJ数据集是由清华大学信息科学与技术国家研究中心创建，专注于北京市东北部主要道路的交通状况，包含500个道路段的交通速度数据，单位为公里/小时。该数据集反映了北京市中心区域的复杂交通情况，特别是频繁发生的交通拥堵。创建过程中，数据从腾讯地图的导航数据中提取和整理，旨在为城市交通预测提供高质量的实证数据。该数据集适用于研究城市交通拥堵预测，有助于优化交通管理和城市规划，提升市民出行体验。

The NE-BJ dataset was developed by the National Research Center for Information Science and Technology at Tsinghua University. It focuses on the traffic conditions of major roads in the northeastern part of Beijing, and contains traffic speed data from 500 road segments with the unit of km/h. This dataset reflects the complex traffic situation in Beijing's central urban area, particularly the frequently occurring traffic congestion. The data was extracted and organized from the navigation data of Tencent Maps during the dataset's creation, aiming to provide high-quality empirical data for urban traffic prediction research. This dataset is applicable to studies on urban traffic congestion prediction, and helps optimize traffic management and urban planning, thereby improving citizens' travel experience.

提供机构：

清华大学信息科学与技术国家研究中心

创建时间：

2021-04-30

搜集汇总

数据集介绍

构建方式

NE-BJ数据集是针对城市交通预测任务而构建的，收集了2020年7月北京市东北部主要道路上的交通速度数据。数据集包含500个道路段的交通速度数据，被视为图中的节点。为了构建空间拓扑结构，数据集使用道路网络距离或欧几里得距离来计算节点之间的权重，并通过高斯核函数进行阈值处理。时间粒度设置为5分钟，并对速度数据进行Z-Score标准化。数据集分为训练集、测试集和验证集，其中NE-BJ数据集的前15天用于训练，最后5天用于测试，其余3天用于验证。

特点

NE-BJ数据集具有以下特点：1）反映复杂城市交通状况：数据集包含北京市东北部主要道路上的交通速度数据，能够充分反映城市交通拥堵情况，为研究提供有价值的参考。2）动态拓扑结构建模：数据集使用动态邻接矩阵来描述道路网络拓扑结构，能够更好地捕捉交通网络中节点之间的动态相关性。3）标准化基准：数据集与METR-LA和PEMS-BAY数据集一起，为研究人员提供了一个可复现的标准基准，方便进行公平比较和进一步研究。

使用方法

NE-BJ数据集可用于交通预测任务，支持使用图神经网络（GNN）和循环神经网络（RNN）等深度学习模型进行训练和预测。数据集提供了训练集、测试集和验证集，方便研究人员进行模型训练和评估。此外，数据集还提供了空间拓扑结构和时间粒度等信息，方便研究人员进行数据预处理和模型构建。

背景与挑战

背景概述

随着城市化的快速发展，交通系统面临着巨大压力。交通预测作为智能交通系统（ITS）的基石，对于理解和发展最优的交通系统、减少交通拥堵、提高交通效率以及为公共安全应急管理提供预警具有重要意义。准确预测未来交通状况，可以为城市规划、交通管理和出行者提供参考，从而提高出行质量。交通预测问题可以表述为多变量时间序列预测问题，其中辅助先验知识包括预定义的邻接矩阵。为了解决交通预测中的挑战，研究人员提出了多种方法，例如基于统计的传统方法、基于深度学习的循环神经网络（RNN）、卷积神经网络（CNN）和注意力机制等。然而，这些方法在处理交通数据的动态特性和时空相关性方面存在一定的局限性。

当前挑战

交通预测领域面临着以下挑战：1）交通图拓扑的动态特性需要进一步建模。预定义的邻接矩阵和自适应邻接矩阵都是静态的，无法充分反映现实中路网拓扑的动态特性。2）基于静态距离的图和基于动态属性的图从不同的角度描述了交通网络的拓扑结构，将它们结合起来可以给模型提供更广泛的视野来捕捉空间依赖性。然而，大多数工作未能将它们融合在一起，同时保持效率和避免过度平滑。3）尽管RNN及其变体在时间序列预测中广泛使用，但其训练速度受到内部循环操作的限制，阻碍了诸如序列到序列等架构在交通预测任务中的应用。4）随着交通预测领域的快速发展，提出的模型和交通数据集的数量不断增加，模型在不同的数据集上使用不同的实验设置进行评估，这使得研究人员难以进行公平的比较、复现工作或开发自己的模型，阻碍了相关领域的发展。

常用场景

经典使用场景

NE-BJ数据集作为交通预测领域的经典数据集，广泛应用于智能交通系统、城市规划等领域。该数据集包含北京市东北部500个道路段的交通速度数据，能够有效反映城市交通拥堵状况。通过对NE-BJ数据集进行分析和预测，可以为城市交通管理、交通规划等提供重要参考，从而缓解交通拥堵，提高交通效率，并为公众安全应急管理提供预警。

衍生相关工作

NE-BJ数据集衍生了许多相关的研究工作。例如，基于NE-BJ数据集，研究人员提出了动态图生成方法，用于捕捉交通网络中节点之间动态变化的拓扑关系；提出了动态图卷积循环网络（DGCRN）模型，有效地提高了交通预测的准确性；提出了交通预测基准，用于评估和比较不同交通预测模型的性能。这些相关工作进一步推动了交通预测领域的发展。

数据集最近研究