five

cora, citeseer, pubmed, amazon-computers, amazon-photo

收藏
github2021-12-03 更新2024-05-31 收录
下载链接:
https://github.com/hujunxianligong/CAPGNN
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集用于支持论文中的Contrastive Adaptive Propagation Graph Neural Networks模型,用于高效的图学习任务。

本数据集旨在为论文中所述的对比自适应传播图神经网络模型提供支持,该模型适用于高效的图学习任务。
创建时间:
2021-12-02
原始信息汇总

数据集概述

数据集名称

  • CAPGNN

数据集来源

支持的数据集

  • cora
  • citeseer
  • pubmed
  • amazon-computers
  • amazon-photo

运行命令

  • 命令格式:sh run_capgnn_${DATASET}.sh ${METHOD} ${GPUS}
  • 示例:sh run_capgnn_cora.sh CAPGAT 0

引用信息

html @misc{hu2021contrastive, title={Contrastive Adaptive Propagation Graph Neural Networks for Efficient Graph Learning}, author={Jun Hu and Shengsheng Qian and Quan Fang and Changsheng Xu}, year={2021}, eprint={2112.01110}, archivePrefix={arXiv}, primaryClass={cs.LG} }

搜集汇总
数据集介绍
main_image_url
构建方式
该数据集构建于图神经网络(GNN)研究领域,旨在支持对比自适应传播图神经网络(CAPGNN)的实验验证。数据集的构建过程涉及从公开的学术文献和商品评论中提取节点和边信息,形成图结构数据。具体而言,cora、citeseer和pubmed数据集源自学术论文引用网络,而amazon-computers和amazon-photo数据集则基于亚马逊商品评论的共现关系构建。每个数据集均经过预处理,确保节点特征和标签的完整性,以便于模型训练和评估。
特点
该数据集的特点在于其多样性和广泛的应用场景。cora、citeseer和pubmed数据集专注于学术文献的引用关系,节点代表论文,边表示引用关系,适用于研究文献分类和知识图谱构建。amazon-computers和amazon-photo数据集则聚焦于商品评论的共现关系,节点代表商品,边表示共同购买或评论关系,适用于推荐系统和商品分类任务。所有数据集均提供节点特征和标签,支持监督学习和半监督学习任务。
使用方法
该数据集的使用方法主要通过CAPGNN框架实现。用户可通过运行提供的Shell脚本,选择不同的数据集和模型(如CAPGCN或CAPGAT)进行实验。脚本支持多GPU并行计算,用户需指定GPU编号以加速训练过程。运行结果将自动保存至文本文件中,便于后续分析。此外,用户可根据需求调整超参数,以优化模型性能。该数据集的使用不仅限于CAPGNN框架,还可用于其他图神经网络模型的实验验证。
背景与挑战
背景概述
Cora、Citeseer、PubMed、Amazon-Computers和Amazon-Photo数据集是图神经网络(GNN)研究领域中的经典基准数据集,广泛应用于节点分类、链接预测等任务。这些数据集由多个研究机构在不同时间创建,其中Cora和Citeseer最早由McCallum等人于2000年左右提出,主要用于文本分类任务;PubMed则聚焦于生物医学文献的引用网络。Amazon-Computers和Amazon-Photo则是基于亚马逊商品购买关系构建的图数据集,用于研究商品推荐和图结构分析。这些数据集为图神经网络的发展提供了重要的实验基础,推动了图表示学习领域的进步。
当前挑战
这些数据集在应用过程中面临多重挑战。首先,图数据的异质性和稀疏性使得模型难以捕捉有效的节点特征和结构信息,尤其是在Citeseer和PubMed等大规模引用网络中。其次,Amazon-Computers和Amazon-Photo数据集中的商品关系图存在噪声和不平衡问题,增加了模型训练的难度。此外,构建这些数据集时,研究人员需要处理原始数据的复杂性和多样性,例如文本数据的预处理、引用关系的提取以及商品购买记录的清洗与整合。这些挑战不仅考验了数据集的构建质量,也对图神经网络模型的鲁棒性和泛化能力提出了更高要求。
常用场景
经典使用场景
在图形神经网络(GNN)的研究中,Cora、Citeseer、PubMed、Amazon-Computers和Amazon-Photo数据集常被用于节点分类任务。这些数据集通过提供丰富的节点特征和边信息,帮助研究者验证和比较不同GNN模型在分类准确性和计算效率上的表现。特别是在对比学习框架下,这些数据集能够有效展示模型如何通过自适应传播机制提升学习效率。
衍生相关工作
基于这些数据集,研究者提出了多种改进的图神经网络模型,如CAPGNN。这些模型通过引入对比学习和自适应传播机制,显著提升了图数据的学习效率和模型性能。此外,这些数据集还催生了一系列关于图神经网络可扩展性和鲁棒性的研究,为图数据挖掘领域提供了丰富的理论支持和实践指导。
数据集最近研究
最新研究方向
近年来,图神经网络(GNN)在社交网络、推荐系统和生物信息学等领域展现出强大的数据处理能力。CAPGNN(对比自适应传播图神经网络)作为一种新型的图学习方法,通过引入对比学习和自适应传播机制,显著提升了图数据的学习效率。该模型在Cora、Citeseer、PubMed等经典数据集上表现出色,尤其在处理大规模图数据时,能够有效减少计算资源的消耗。CAPGNN的研究不仅推动了图神经网络在复杂网络分析中的应用,还为图数据的自监督学习提供了新的思路。随着图数据在各个领域的广泛应用,CAPGNN的研究方向将继续聚焦于提升模型的泛化能力和计算效率,以应对日益增长的数据规模和复杂性。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作