five

DHG-Bench

收藏
arXiv2025-08-17 更新2025-08-22 收录
下载链接:
https://github.com/Coco-Hut/DHG-Bench
下载链接
链接失效反馈
官方服务:
资源简介:
DHG-Bench是一个全面的基准测试,用于评估深度超图学习(DHGL)中的超图神经网络(HNN)算法。该数据集由20个涵盖节点级、边级和图级任务的多样化数据集组成,旨在促进对HNN算法在有效性、效率、鲁棒性和公平性方面的全面研究。通过统一的API和一致的数据处理方法,DHG-Bench提供了一个公平的评估环境,以促进HNN研究的发展。

DHG-Bench is a comprehensive benchmark designed for evaluating Hypergraph Neural Network (HNN) algorithms in the field of Deep Hypergraph Learning (DHGL). It comprises 20 diverse datasets spanning node-level, edge-level, and graph-level tasks, with the goal of facilitating comprehensive research on HNN algorithms across four key dimensions: effectiveness, efficiency, robustness, and fairness. Equipped with a unified API and standardized data processing workflows, DHG-Bench provides a fair evaluation framework to advance the development of HNN-related research.
提供机构:
新南威尔士大学, 浙江工商大学, 上海交通大学
创建时间:
2025-08-17
搜集汇总
数据集介绍
main_image_url
构建方式
DHG-Bench通过系统整合20个多样化超图数据集构建而成,涵盖节点分类、超边预测和图级分类三大任务,覆盖同质性与异质性超图结构。数据源自学术引用网络、电子商务平台及社交网络等多个领域,采用统一的数据预处理流程,包括标准化特征提取、标签分配及数据集划分策略,确保数据质量与一致性。构建过程中严格遵循可复现性原则,所有数据集均经过清洗与验证,以支持跨算法的公平比较。
使用方法
DHG-Bench通过开源库提供标准化接口,支持16种先进超图神经网络算法的训练与评估。用户可通过统一API加载数据集、配置模型超参数,并执行节点分类、超边预测或超图分类任务。评估模块涵盖有效性、效率、鲁棒性与公平性四个维度,支持自定义实验协议与指标计算。所有实验脚本与预处理流程公开,确保完全可复现,并便于扩展新算法或数据集。
背景与挑战
背景概述
DHG-Bench由新南威尔士大学、浙江工商大学和上海交通大学的研究团队于2025年联合推出,旨在解决深度超图学习领域缺乏标准化评估框架的问题。该数据集整合了20个跨学术、电商和社交网络领域的超图数据集,涵盖节点分类、超边预测和图级分类三大任务,并集成了16种前沿超图神经网络算法。通过统一的实验协议和评估维度,DHG-Bench为超图神经网络在有效性、效率、鲁棒性和公平性方面的系统性评估提供了重要基础,推动了高阶关系建模研究的可比性与可复现性。
当前挑战
DHG-Bench需解决超图神经网络在异配性超图上的泛化性能不足、大规模数据处理时的计算效率瓶颈,以及对抗结构噪声与特征扰动的鲁棒性缺陷等核心问题。构建过程中面临多源数据集格式统一、超边负采样策略设计、异构超图结构标准化,以及跨维度评估指标一致性等挑战,需通过混合负采样和统一数据拆分策略确保评估的全面性与公平性。
常用场景
经典使用场景
在复杂系统建模领域,DHG-Bench作为深度超图学习的综合性基准测试平台,其经典应用场景聚焦于多类型任务的统一评估框架。该数据集通过整合20个跨领域超图数据集,覆盖节点分类、超边预测和图级分类三大核心任务,为研究者提供了系统化验证超图神经网络(HNN)性能的标准化环境。例如在学术合作网络中,通过超边连接合著论文的作者节点,评估模型对高阶协作关系的表征能力;在电商场景中则模拟用户-商品交互的超图结构,测试推荐系统的预测精度。
解决学术问题
DHG-Bench解决了超图学习领域长期存在的算法评估碎片化问题。传统研究因数据集异构性、预处理差异和评估指标不统一导致结果难以复现与对比。该基准通过统一数据划分策略、标准化超参数配置和四维评估体系(有效性、效率、鲁棒性、公平性),系统揭示了HNN模型在异质性超图上的泛化瓶颈。例如实验表明现有模型在同配性超图(如Cora引文网络)表现优异,但在异配性场景(如Yelp商户评级)准确率下降超过40%,这为高阶关系建模的理论研究提供了关键实证依据。
实际应用
该数据集的实际应用价值体现在对工业级复杂系统的建模支持。在电子商务领域,基于Walmart数据集的超图构建可优化商品捆绑推荐策略,通过超边模拟用户共同购买行为提升营销转化率;在社交网络分析中,Pokec数据集的人物关系超图有助于社区发现和影响力传播预测;金融风控场景则利用German Credit数据集评估信贷风险,通过超边连接具有相似信贷历史的用户群体,为银行提供动态风险评估模型。这些应用均受益于基准测试中验证的模型鲁棒性和跨领域迁移能力。
数据集最近研究
最新研究方向
随着超图神经网络在复杂系统建模中的广泛应用,DHG-Bench作为首个综合性基准测试框架,推动了超图学习领域在多重维度上的深入研究。当前研究聚焦于异质超图上的泛化性能优化,尤其在节点分类任务中,模型在异质性数据上的表现显著弱于同质超图,凸显了结构适应性算法的迫切需求。超边预测任务中,传统方法如HGNN和HyperGCN仍保持竞争力,而新近算法在跨数据集泛化上存在明显不足,促使学者探索统一架构以提升跨任务一致性。此外,可扩展性与效率的平衡成为关键挑战,大规模超图上的内存溢出和计算瓶颈催生了训练解耦(如TF-HNN)和张量稀疏化等创新方向。鲁棒性研究揭示了对结构扰动和标签噪声的敏感性,尤其在监督信号噪声下性能衰减显著,推动了抗干扰训练机制的发展。公平性评估首次系统化,暴露了消息传递机制对敏感属性的放大效应,未来研究需整合去偏置技术以实现伦理对齐。这些方向共同指向超图学习在工业级应用中的可靠性、高效性与道德合规性提升。
相关研究论文
  • 1
    DHG-Bench: A Comprehensive Benchmark on Deep Hypergraph Learning新南威尔士大学, 浙江工商大学, 上海交通大学 · 2025年
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作