Dynamic-graph-dataset
收藏github2024-03-05 更新2024-05-31 收录
下载链接:
https://github.com/seven-echo/Dynamic-graph-dataset
下载链接
链接失效反馈官方服务:
资源简介:
动态图/网络数据集,用于动态图/网络嵌入/表示。
Dynamic graph/network dataset, used for dynamic graph/network embedding/representation.
创建时间:
2020-03-26
原始信息汇总
数据集概述
数据集列表
| 数据集 | 节点数 | 边数 | 属性数 | 异质性 | 时间跨度 | 标签数 | 来源 |
|---|---|---|---|---|---|---|---|
| bitcoin-OTC | 5,881 | 35,592 | - | - | 137 | - | EvolveGCN AAAI20 |
| bitcoin-Alpha | 3,777 | 24,173 | - | - | 136 | - | EvolveGCN AAAI20 |
| Aminer | 51,060 | 794,552 | - | - | 16 | - | DynamicTriad AAAI18 |
| PPI | 16,458 | 144,033 | - | - | 37 | - | tNodeEmbedding IJCAI19 |
| Facebook Wall post | 46,952 | 876,993 | - | - | 46 | - | tNodeEmbedding IJCAI19 |
| Facebook friendships | 63,731 | 817,035 | - | - | 26 | - | tNodeEmbedding IJCAI19 |
| Slashdot | 51,083 | 140,778 | - | - | 12 | - | tNodeEmbedding IJCAI19 |
| Cora | 12,588 | 47,675 | - | - | 39 | - | tNodeEmbedding IJCAI19 |
| digg | 283,183 | 6,473,708 | - | - | unclear | - | node2bits PKDD19 |
| wiki | 1,140,149 | 7,833,140 | - | - | unclear | - | node2bits PKDD19 |
| digg_friends | 71,367 | 1,731,658 | - | - | unclear | - | DNPS TKDE19 |
| MovieLens-10M | 20,537 | 43,760 | - | - | 13 | - | DySAT WSDM20 |
| Higgs Twitter | 456,626 | 14,855,842 | - | edge | 7 Days | - | SNAP standford |
| DBLP | 28,085 | 339,788 | - | - | 27 | 10 | MMDNE CIKM19 |
| Tmall | 577,314 | 7,800,509 | - | - | 186 | 5 | MMDNE CIKM19 |
| Epinions | 163,543 | 581,983 | 44 | - | 12 | - | Our |
| DBLP | 781,108 | 4,191,677 | 160,648 | - | 10 | - | Our |
搜集汇总
数据集介绍

构建方式
Dynamic-graph-dataset的构建基于多个公开的动态图数据源,涵盖了社交网络、学术合作、电子商务等多个领域。每个数据集均从原始数据中提取节点、边及其时间跨度信息,确保数据的多样性和代表性。数据集的构建过程严格遵循数据清洗和格式标准化,以确保其适用于动态图嵌入和表示学习任务。
特点
该数据集以其广泛的时间跨度和多样的网络结构为显著特点,涵盖了从数千到数百万节点和边的规模。数据集中的每个图均具有明确的时间维度,能够反映网络随时间的动态变化。此外,部分数据集还包含节点属性信息,为研究提供了更丰富的上下文。
使用方法
Dynamic-graph-dataset适用于动态图嵌入、网络表示学习及时间序列分析等研究任务。用户可通过加载数据集中的节点、边及时间信息,构建动态图模型。数据集支持多种图神经网络框架,便于研究者进行实验和算法验证。使用前需根据具体任务对数据进行预处理,如时间切片或特征提取。
背景与挑战
背景概述
Dynamic-graph-dataset是一个专注于动态图/网络嵌入与表示的数据集,旨在为研究者提供丰富的动态图数据资源。该数据集由多个子数据集组成,涵盖了比特币交易网络、社交网络、学术合作网络等多个领域。其创建时间可追溯至2018年,主要研究人员和机构包括斯坦福大学、AAAI会议以及IJCAI会议的相关团队。核心研究问题在于如何高效地捕捉动态图中节点和边的演化特征,以支持图嵌入、节点分类、链接预测等任务。该数据集在动态图分析领域具有重要影响力,为相关算法的开发与验证提供了坚实的基础。
当前挑战
Dynamic-graph-dataset在解决动态图嵌入问题时面临多重挑战。首先,动态图的时序特性使得传统静态图方法难以直接应用,需要设计能够捕捉时间演化的新算法。其次,数据集的规模庞大且异质性高,例如Higgs Twitter子数据集包含超过1400万条边,这对计算资源和算法效率提出了极高要求。在构建过程中,数据采集与清洗也面临挑战,例如部分子数据集的时间跨度不明确,且节点和边的属性信息缺失,增加了数据处理的复杂性。此外,如何在不同领域的动态图数据上实现通用性,也是该数据集需要解决的关键问题。
常用场景
经典使用场景
Dynamic-graph-dataset广泛应用于动态图嵌入和表示学习领域,特别是在社交网络、金融交易和学术合作网络等场景中。该数据集通过捕捉节点和边随时间变化的特性,为研究者提供了丰富的实验数据,用于验证和优化动态图模型。例如,在比特币交易网络中,研究者可以利用该数据集分析用户信任关系的演变,从而预测未来的交易行为。
衍生相关工作
Dynamic-graph-dataset催生了众多经典研究工作,如EvolveGCN、DynamicTriad和DySAT等。这些工作基于该数据集提出了创新的动态图嵌入算法,推动了动态图建模领域的发展。例如,EvolveGCN通过引入图卷积网络的动态演化机制,显著提升了动态图嵌入的性能。DynamicTriad则通过捕捉三元组结构的动态变化,为社交网络分析提供了新的视角。这些工作不仅丰富了动态图建模的理论体系,还为实际应用提供了有力的技术支持。
数据集最近研究
最新研究方向
在动态图数据领域,Dynamic-graph-dataset为研究者提供了丰富的实验基础,涵盖了从社交网络到电子商务的多种应用场景。近年来,动态图嵌入和表示学习成为该领域的前沿研究方向,特别是在处理大规模、高维度的动态图数据时,如何有效捕捉节点和边的时序变化成为关键挑战。例如,EvolveGCN和DySAT等模型通过引入时间维度,显著提升了动态图嵌入的精度和效率。此外,随着图神经网络(GNN)的快速发展,动态图数据在推荐系统、社交网络分析和知识图谱构建中的应用也日益广泛。这些研究不仅推动了动态图算法的创新,还为实际应用中的复杂网络分析提供了强有力的工具。
以上内容由遇见数据集搜集并总结生成



