five

G-OSR

收藏
arXiv2025-03-01 更新2025-03-06 收录
下载链接:
http://arxiv.org/abs/2503.00476v1
下载链接
链接失效反馈
资源简介:
G-OSR是一个全面的基准测试,旨在评估在节点级别和图级别任务上的图开集识别方法。该基准测试使用了来自多个领域的现实世界数据集,包括引文网络、社交媒体、电子商务平台和分子图,以确保在传统、GOODD、GOSR和GAD方法之间进行公平和标准化的效果和效率比较。
提供机构:
山东大学,香港理工大学,康奈尔大学,北京大学,国王阿卜杜拉科技大学
创建时间:
2025-03-01
AI搜集汇总
数据集介绍
main_image_url
构建方式
G-OSR数据集的构建旨在提供一个全面的基准,用于评估图开放集识别(GOSR)方法。该数据集整合了来自多个领域的现实世界数据集,包括引用网络、社交媒体、购物网站和分子图,以确保在节点和图级别上的公平和标准化比较。通过使用来自不同领域的真实世界数据集,G-OSR旨在提供一个全面的环境,以评估传统、图出分布检测(GOODD)、GOSR和图异常检测(GAD)方法的有效性和效率。
特点
G-OSR数据集的特点在于其全面性和多样性。它涵盖了多个领域的数据集,包括引用网络、社交媒体、购物网站和分子图,以确保GOSR方法的有效性和效率。此外,G-OSR数据集还涵盖了节点和图级别的开放集识别任务,以及传统、GOODD、GOSR和GAD方法。这种全面性使得G-OSR成为一个宝贵的资源,可用于评估和比较不同的GOSR方法,并推动该领域的研究进展。
使用方法
使用G-OSR数据集的方法涉及评估不同GOSR方法在节点和图级别上的性能。这包括传统、GOODD、GOSR和GAD方法。通过在标准化的实验设置下对这些方法进行评估,研究人员可以比较它们在识别和分类已知和未知类别的样本方面的表现。此外,G-OSR数据集还允许研究人员探索不同方法在不同类设置下的性能动态和鲁棒性。通过分析这些结果,研究人员可以深入了解GOSR方法的适用性和局限性,并为未来研究提供有价值的见解。
背景与挑战
背景概述
在机器学习领域,图神经网络(GNNs)在社交网络、生物信息学、知识图谱等领域取得了显著成功。然而,现有的研究大多假设理想的环境是封闭的,即所有测试类都是训练期间可见的类。然而,在现实世界的开放环境中,由于欠采样、分布外或异常样本的存在,图学习模型面临着鲁棒性和可靠性的挑战。为了应对这些问题并确保GNN在实际场景中的有效应用,需要研究图开放集识别(GOSR)方法。GOSR旨在识别和正确分类属于训练期间遇到的已知类别的图数据样本,同时识别和处理来自新颖的、未见过的新类别的样本。为了评估GOSR方法的有效性和效率,并促进该领域的研究,本文介绍了G-OSR,一个全面的基准,用于评估节点和图级别的GOSR方法。G-OSR利用来自多个领域的真实世界数据集,确保公平和标准化的比较,并提供了对当前GOSR方法的泛化能力和局限性的重要见解。
当前挑战
G-OSR面临的挑战包括:1)任务级别的评估有限;2)跨领域的验证不足;3)相关领域之间的脱节;4)技术配置的差异性。为了解决这些挑战,G-OSR提供了一个全面的基准,涵盖了节点和图级别的GOSR任务,并使用了来自多个领域的真实世界数据集。通过在标准化实验设置下对各种方法进行广泛评估,G-OSR提供了对当前GOSR方法的泛化能力和局限性的重要见解,并促进了该领域的研究。
常用场景
经典使用场景
G-OSR数据集主要用于评估和比较图开放集识别(GOSR)方法在节点和图级别任务上的性能。该数据集涵盖了多个领域的真实世界数据集,包括引文网络、社交媒体、购物网站和分子图等,确保了公平和标准化的比较。通过在标准化实验条件下进行广泛的评估,G-OSR提供了对不同方法有效性和效率的全面评估,为推动GOSR领域的研究进展提供了宝贵的资源。
衍生相关工作
G-OSR数据集衍生了一系列相关的研究工作。例如,一些研究工作基于G-OSR数据集,提出了新的GOSR方法,如OpenWGL和EMP,这些方法利用变分图自动编码器和熵传播等技术来提高开放世界图学习的性能。此外,一些研究工作也探索了将GOSR技术应用于其他领域,如材料科学和化学结构分析,以发现新的现象和分类新的实体。G-OSR数据集为GOSR领域的研究提供了重要的基础和资源,推动了该领域的发展和创新。
数据集最近研究
最新研究方向
随着图神经网络(GNNs)在机器学习领域的广泛应用,如社交网络、生物信息学、知识图谱等,开放集环境下的图学习模型鲁棒性和可靠性成为研究热点。G-OSR数据集的提出为图开放集识别(GOSR)方法提供了全面的基准,涵盖了节点和图级别的多种任务和领域数据集,以评估传统、GOODD、GOSR和GAD方法的效率和效果。研究显示,图特定方法在处理开放集环境下的图数据时表现出更强的性能,而传统方法在复杂图数据上的性能则有所下降。此外,图异常检测方法在图开放集识别任务中显示出一定的潜力,但需要更深入的理解和调整。未来研究将集中在改进GOSR技术,增强模型在未知图结构和节点分布上的泛化能力,并探索GOSR在科学领域的应用,如生物信息学、材料科学和社交网络分析。
相关研究论文
  • 1
    G-OSR: A Comprehensive Benchmark for Graph Open-Set Recognition山东大学,香港理工大学,康奈尔大学,北京大学,国王阿卜杜拉科技大学 · 2025年
以上内容由AI搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作