Long Range Graph Benchmark (LRGB)
收藏arXiv2023-11-28 更新2024-06-21 收录
下载链接:
https://github.com/vijaydwivedi75/lrgb
下载链接
链接失效反馈官方服务:
资源简介:
Long Range Graph Benchmark (LRGB) 是由南洋理工大学的Vijay Prakash Dwivedi等人创建的一个包含5个图学习数据集的基准。这些数据集包括PascalVOC-SP, COCO-SP, PCQM-Contact, Peptides-func和Peptides-struct,旨在评估模型在处理长距离交互(LRI)任务上的性能。数据集涵盖计算机视觉和化学领域,要求模型能够理解和利用图中的长距离依赖关系以实现高性能。LRGB通过对比基线GNN和图Transformer网络,验证了捕捉长距离依赖的模型在这些任务上表现更佳。这些数据集适合用于基准测试和探索旨在捕捉LRI的MP-GNN和图Transformer架构。
Long Range Graph Benchmark (LRGB) was created by Vijay Prakash Dwivedi et al. from Nanyang Technological University. It is a benchmark containing 5 graph learning datasets, including PascalVOC-SP, COCO-SP, PCQM-Contact, Peptides-func and Peptides-struct, which aims to evaluate model performance on long-range interaction (LRI) tasks. The datasets cover the fields of computer vision and chemistry, requiring models to understand and leverage long-range dependencies in graphs to achieve high performance. LRGB has verified that models capturing long-range dependencies perform better on these tasks through comparisons between baseline GNNs and graph Transformer networks. These datasets are suitable for benchmarking and exploring MP-GNN and graph Transformer architectures designed to capture LRI.
提供机构:
南洋理工大学, 新加坡
创建时间:
2022-06-16
搜集汇总
数据集介绍

构建方式
LRGB数据集通过将现实世界的图学习任务分解为节点、边和图级别的预测任务,构建了一个包含五个图学习数据集的基准。这些数据集包括PascalVOC-SP、COCO-SP、PCQM-Contact、Peptides-func和Peptides-struct,它们分别来自计算机视觉和化学领域。为了满足长程交互(LRI)推理的要求,LRGB数据集的构建采用了多种方法,包括提取图像中的超像素节点、构建分子图和构建肽图。这些方法能够有效地模拟长程依赖关系,并提供了大量的节点和边特征,以便模型能够学习到长程交互的重要性。
特点
LRGB数据集的特点在于其规模和任务的多样性。这些数据集具有较大的图尺寸和复杂的图结构,这要求模型能够有效地处理长程交互。此外,LRGB数据集包含了多种类型的图学习任务,包括节点分类、链接预测和图回归,这为模型评估和开发提供了广泛的应用场景。最后,LRGB数据集的构建方法能够有效地模拟长程依赖关系,这使得模型能够在这些数据集上展现出更好的性能。
使用方法
使用LRGB数据集进行模型评估和开发时,可以采用以下方法:首先,选择合适的模型,包括基于消息传递的图神经网络(MP-GNN)和基于Transformer的图网络。其次,进行模型训练和评估,使用LRGB数据集提供的节点、边和图级别的预测任务来评估模型的性能。最后,根据模型的性能表现,进行模型优化和改进,以提高模型在处理长程交互方面的能力。此外,LRGB数据集还提供了多种数据集变体和图构造格式,以便用户可以根据自己的需求进行选择和调整。
背景与挑战
背景概述
在图神经网络(GNNs)的研究中,基于消息传递(MP)范式的GNNs通常在每一层交换一跳邻居之间的信息来构建节点表示。然而,这种网络在捕获长距离交互(LRI)方面存在局限性。为了解决这一问题,研究人员提出了基于Transformer的方法,这些方法能够考虑图中的完整节点连接性,从而能够建模LRI。然而,传统的基于MP的GNNs在现有的一些图基准测试中,当与位置特征表示等其他创新相结合时,往往表现更好,从而限制了Transformer-like架构的效用和排名。为了解决这个问题,Vijay Prakash Dwivedi等人提出了一个名为Long Range Graph Benchmark (LRGB)的数据集,包含5个图学习数据集:PascalVOC-SP、COCO-SP、PCQM-Contact、Peptides-func和Peptides-struct,这些数据集需要LRI推理才能在给定任务中取得良好的性能。该数据集旨在用于基准测试和探索具有捕获LRI能力的MP-GNNs和Graph Transformer架构。
当前挑战
LRGB数据集的挑战主要在于,传统的基于MP的GNNs在捕获LRI方面存在局限性,而基于Transformer的方法虽然能够考虑图中的完整节点连接性,但在现有的一些图基准测试中,当与位置特征表示等其他创新相结合时,往往表现更好,从而限制了Transformer-like架构的效用和排名。此外,LRGB数据集的构建过程中也遇到了一些挑战,例如如何有效地建模LRI、如何设计合适的评估指标等。
常用场景
经典使用场景
LRGB数据集主要用于评估和探索图神经网络(GNN)和图Transformer架构在捕获长距离依赖(LRI)方面的能力。该数据集包含了五个图学习数据集:PascalVOC-SP、COCO-SP、PCQM-Contact、Peptides-func和Peptides-struct,这些数据集在执行特定任务时需要LRI推理。通过在LRGB数据集上对基线GNN和图Transformer网络进行基准测试,验证了能够捕获长距离依赖的模型在这些任务上的表现显著更好。
衍生相关工作
LRGB数据集的提出和应用促进了相关研究的进展。例如,一些研究工作利用LRGB数据集评估和改进图Transformer的性能,并提出了一些新的图Transformer架构,例如GraphiT、Graphormer等。此外,LRGB数据集还为探索新的图神经网络训练方法和优化算法提供了实验平台,这些方法可以更好地捕获和处理长距离依赖。
数据集最近研究
最新研究方向
长程图神经网络(GNNs)在消息传递(MP)范式中,通常仅在1跳邻域内交换信息,以在每个层构建节点表示。然而,这种网络在处理长程交互(LRI)方面存在局限性。LRGB数据集的提出,旨在为长程依赖建模的GNNs和图Transformer架构提供一个评估平台。LRGB包含5个需要长程推理才能在给定任务中取得优异成绩的图学习数据集:PascalVOC-SP、COCO-SP、PCQM-Contact、Peptides-func和Peptides-struct。这些数据集通过实验验证了能够捕获长程依赖的模型在相关任务上表现显著更好。LRGB数据集的提出,对于探索和发展新的GNN和Graph Transformer架构,特别是在长程交互建模方面,具有重要意义。
相关研究论文
- 1Long Range Graph Benchmark南洋理工大学, 新加坡 · 2023年
以上内容由遇见数据集搜集并总结生成



