DHG-Bench

Name: DHG-Bench
Creator: 新南威尔士大学, 浙江工商大学, 上海交通大学
Published: 2025-08-17 13:19:47
License: 暂无描述

arXiv2025-08-17 更新2025-08-22 收录

下载链接：

https://github.com/Coco-Hut/DHG-Bench

下载链接

链接失效反馈

官方服务：

资源简介：

DHG-Bench是一个全面的基准测试，用于评估深度超图学习（DHGL）中的超图神经网络（HNN）算法。该数据集由20个涵盖节点级、边级和图级任务的多样化数据集组成，旨在促进对HNN算法在有效性、效率、鲁棒性和公平性方面的全面研究。通过统一的API和一致的数据处理方法，DHG-Bench提供了一个公平的评估环境，以促进HNN研究的发展。

DHG-Bench is a comprehensive benchmark designed for evaluating Hypergraph Neural Network (HNN) algorithms in the field of Deep Hypergraph Learning (DHGL). It comprises 20 diverse datasets spanning node-level, edge-level, and graph-level tasks, with the goal of facilitating comprehensive research on HNN algorithms across four key dimensions: effectiveness, efficiency, robustness, and fairness. Equipped with a unified API and standardized data processing workflows, DHG-Bench provides a fair evaluation framework to advance the development of HNN-related research.

提供机构：

新南威尔士大学, 浙江工商大学, 上海交通大学

创建时间：

2025-08-17

搜集汇总

数据集介绍

构建方式

DHG-Bench通过系统整合20个多样化超图数据集构建而成，涵盖节点分类、超边预测和图级分类三大任务，覆盖同质性与异质性超图结构。数据源自学术引用网络、电子商务平台及社交网络等多个领域，采用统一的数据预处理流程，包括标准化特征提取、标签分配及数据集划分策略，确保数据质量与一致性。构建过程中严格遵循可复现性原则，所有数据集均经过清洗与验证，以支持跨算法的公平比较。

使用方法

DHG-Bench通过开源库提供标准化接口，支持16种先进超图神经网络算法的训练与评估。用户可通过统一API加载数据集、配置模型超参数，并执行节点分类、超边预测或超图分类任务。评估模块涵盖有效性、效率、鲁棒性与公平性四个维度，支持自定义实验协议与指标计算。所有实验脚本与预处理流程公开，确保完全可复现，并便于扩展新算法或数据集。

背景与挑战

背景概述

DHG-Bench由新南威尔士大学、浙江工商大学和上海交通大学的研究团队于2025年联合推出，旨在解决深度超图学习领域缺乏标准化评估框架的问题。该数据集整合了20个跨学术、电商和社交网络领域的超图数据集，涵盖节点分类、超边预测和图级分类三大任务，并集成了16种前沿超图神经网络算法。通过统一的实验协议和评估维度，DHG-Bench为超图神经网络在有效性、效率、鲁棒性和公平性方面的系统性评估提供了重要基础，推动了高阶关系建模研究的可比性与可复现性。

当前挑战

DHG-Bench需解决超图神经网络在异配性超图上的泛化性能不足、大规模数据处理时的计算效率瓶颈，以及对抗结构噪声与特征扰动的鲁棒性缺陷等核心问题。构建过程中面临多源数据集格式统一、超边负采样策略设计、异构超图结构标准化，以及跨维度评估指标一致性等挑战，需通过混合负采样和统一数据拆分策略确保评估的全面性与公平性。

常用场景

经典使用场景

在复杂系统建模领域，DHG-Bench作为深度超图学习的综合性基准测试平台，其经典应用场景聚焦于多类型任务的统一评估框架。该数据集通过整合20个跨领域超图数据集，覆盖节点分类、超边预测和图级分类三大核心任务，为研究者提供了系统化验证超图神经网络（HNN）性能的标准化环境。例如在学术合作网络中，通过超边连接合著论文的作者节点，评估模型对高阶协作关系的表征能力；在电商场景中则模拟用户-商品交互的超图结构，测试推荐系统的预测精度。

解决学术问题

DHG-Bench解决了超图学习领域长期存在的算法评估碎片化问题。传统研究因数据集异构性、预处理差异和评估指标不统一导致结果难以复现与对比。该基准通过统一数据划分策略、标准化超参数配置和四维评估体系（有效性、效率、鲁棒性、公平性），系统揭示了HNN模型在异质性超图上的泛化瓶颈。例如实验表明现有模型在同配性超图（如Cora引文网络）表现优异，但在异配性场景（如Yelp商户评级）准确率下降超过40%，这为高阶关系建模的理论研究提供了关键实证依据。

实际应用

该数据集的实际应用价值体现在对工业级复杂系统的建模支持。在电子商务领域，基于Walmart数据集的超图构建可优化商品捆绑推荐策略，通过超边模拟用户共同购买行为提升营销转化率；在社交网络分析中，Pokec数据集的人物关系超图有助于社区发现和影响力传播预测；金融风控场景则利用German Credit数据集评估信贷风险，通过超边连接具有相似信贷历史的用户群体，为银行提供动态风险评估模型。这些应用均受益于基准测试中验证的模型鲁棒性和跨领域迁移能力。

数据集最近研究