City-Networks
收藏arXiv2025-03-12 更新2025-03-14 收录
下载链接:
https://github.com/LeonResearch/City-Networks
下载链接
链接失效反馈官方服务:
资源简介:
City-Networks是一个由牛津大学提出的大型图数据集,包含来自真实世界城市道路的四个城市网络——巴黎、上海、洛杉矶和伦敦。该数据集以超过10万个节点和长达400的直径,自然地包含了长距离信息,适合于测试图表示学习中的长距离依赖性。数据集通过基于偏心度的方法对节点进行标注,确保分类任务本质上需要来自远距离节点的信息。
提供机构:
牛津大学
创建时间:
2025-03-12
搜集汇总
数据集介绍

构建方式
City-Networks 数据集的构建方式是将现实世界的城市道路网络转化为大型图学习数据集。该数据集由巴黎、上海、洛杉矶和伦敦四个城市的道路网络组成,每个城市网络都被处理成无向图,只表示节点之间的连接性。数据集中的节点代表道路交叉口,边代表道路段。节点特征包括经纬度、相邻道路数量和土地使用类型等,而边特征包括道路长度、速度限制、单向性、逆向性和道路类型等。为了创建需要长距离依赖性的节点标签,使用基于离心率的近似方法对节点进行标注。通过这种方式,City-Networks 数据集能够提供关于长距离交互的重要信息,这对于图表示学习的深入研究具有重要意义。
特点
City-Networks 数据集的特点是具有超过 105 个节点的大规模图,其直径比现有基准数据集大得多,自然地包含了长距离信息。数据集中的节点标签基于离心率的近似值,确保分类任务本质上需要来自远距离节点的信息。此外,数据集还提出了一种基于邻居从远距离跳转的雅可比矩阵的模型无关测量方法,为长距离依赖性提供了有原则的量化。City-Networks 数据集的设计和提出的测量方法都经过了理论上的证明,特别是关注过平滑和影响分数稀释,为图神经网络中长距离交互的进一步探索奠定了坚实的基础。
使用方法
使用 City-Networks 数据集的方法主要包括以下几个方面:首先,通过对比不同层数的模型和采样邻居跳转次数,对经典 GNN 和图变压器在数据集上的性能进行实证测试。其次,基于训练模型的雅可比矩阵,引入了一种模型无关的测量方法,以量化长距离依赖性。最后,从谱的角度对数据集中的图结构进行了理论上的证明,重点关注过平滑现象,并建立了图结构与代数连通性和直径之间的联系。通过这些方法,City-Networks 数据集为研究长距离交互提供了有力的工具,并为图神经网络的进一步发展提供了新的思路。
背景与挑战
背景概述
City-Networks数据集是牛津大学的研究团队于2025年提出的,旨在量化图机器学习中长程交互的重要性。该数据集从真实世界的城市道路中提取,包含超过105个节点的图,具有比现有基准更大的直径,自然地体现了长程信息。通过基于离心率的标注方法,City-Networks数据集确保分类任务内在地需要来自远端节点的信息。此外,研究团队还提出了一种基于邻接节点雅可比矩阵的模型无关的度量方法,为长程依赖的量化提供了理论依据。
当前挑战
City-Networks数据集面临的挑战主要包括:1) 长程交互的量化,如何准确地衡量模型在不同跳数邻居上的影响力,以及如何处理不同模型之间的性能差异;2) 构建过程中遇到的挑战,如如何有效地处理大规模图的数据集,以及如何避免过度平滑和参数过多等问题。
常用场景
经典使用场景
City-Networks数据集广泛应用于图机器学习领域,特别是用于评估图神经网络(GNNs)对长距离交互的处理能力。该数据集提供了具有超过105个节点的图,其直径显著大于现有基准数据集,自然地体现了长距离信息。这使得City-Networks成为测试和开发能够有效捕捉长距离依赖的GNN模型的理想选择。
衍生相关工作
City-Networks数据集的提出和应用激发了图机器学习领域的一系列相关工作。例如,研究人员基于City-Networks数据集开发了一系列新的GNN模型,这些模型能够更有效地捕捉和处理长距离交互。此外,City-Networks数据集还被用于评估和比较不同GNN模型的性能,从而推动了GNN模型的发展和改进。
数据集最近研究
最新研究方向
City-Networks数据集的引入,为图机器学习领域带来了新的研究方向。该数据集基于真实世界的城市道路网络,具有超过105个节点和比现有基准更大的直径,自然地体现了长距离信息。为了更好地理解和量化长距离交互,研究人员提出了一个新的模型无关的测量方法,该方法基于远距离跳转的邻居的雅可比矩阵。这种测量方法提供了一个原理性的长距离依赖量化,为图神经网络中长距离交互的进一步探索奠定了坚实的基础。
相关研究论文
- 1Towards Quantifying Long-Range Interactions in Graph Machine Learning: a Large Graph Dataset and a Measurement牛津大学 · 2025年
以上内容由遇见数据集搜集并总结生成



