Scale-free Graphs

github2021-03-27 更新2024-05-31 收录

下载链接：

https://github.com/xguo7/Dataset-for-Deep-Graph-Translation

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集适用于“一对多”映射版本的图转换。数据集中没有节点特征，目标是学习从输入图拓扑到目标图拓扑的映射。每个输入图生成为有向无标度网络，其度分布遵循幂律属性。生成目标图时，选择一个节点作为目标节点，其概率与其入度成正比，该节点将以0.41的概率连接到新的源节点。类似地，选择一个节点作为源节点，其概率与其出度成正比，该节点将以0.54的概率连接到新的目标节点。然后，通过在两个节点之间添加m（m等于输入图的节点数）条边来生成相应的目标图。因此，输入和目标图都是有向无标度图。

This dataset is suitable for the 'one-to-many' mapping version of graph transformation. The dataset does not contain node features, and the goal is to learn the mapping from the input graph topology to the target graph topology. Each input graph is generated as a directed scale-free network, with its degree distribution following a power-law property. When generating the target graph, a node is selected as the target node with a probability proportional to its in-degree, and this node will connect to a new source node with a probability of 0.41. Similarly, a node is selected as the source node with a probability proportional to its out-degree, and this node will connect to a new target node with a probability of 0.54. Then, the corresponding target graph is generated by adding m (where m equals the number of nodes in the input graph) edges between the two nodes. Therefore, both the input and target graphs are directed scale-free graphs.

创建时间：

2020-03-07

原始信息汇总

数据集概述

本数据集专注于深度图翻译问题，提供了多种合成和真实世界的图数据集，用于研究和探索图之间的映射规则。数据集包括以下几个部分：

1. Scale-free Graphs

问题类型：适合“一对多”映射图翻译版本。
数据内容：包含五个不同大小的子集（节点数为10、20、50、100、150）。
文件格式：每个子集中的输入和输出图分别存储在.csv文件中，文件名格式为"scale-(graph_size)-input-index.csv"和"scale-(graph_size)-target-index.csv"。
数据链接：Scale_free_150等。

2. Erdos-Renyi Graphs

问题类型：适合“一对一”映射图翻译版本。
数据内容：包含三个不同大小的子集（节点数为20、40、60）。
文件格式：每个子集中的输入和输出图分别存储在.csv文件中，文件名格式为"ER-(graph_size)-input-index.csv"和"ER-(graph_size)-target-index.csv"。
数据链接：ER_20等。

3. Barab´asi-Albert Graphs

问题类型：适合“一对一”映射图翻译版本。
数据内容：包含三个不同大小的子集（节点数为20、40、60）。
文件格式：每个子集中的输入和输出图分别存储在.csv文件中，文件名格式为"BA-(graph_size)-input-index.csv"和"BA-(graph_size)-target-index.csv"。
数据链接：BA_20等。

4. IoT

问题背景：涉及物联网中的恶意软件隔离问题。
数据内容：包含三个不同大小的子集（节点数为20、40、60）。
文件格式：每个子集中的输入和输出图分别存储在.csv文件中，文件名格式为"IoT-[graph_size]-[input/output]-[infection rate]-[recovery rate]-[decay rate]-[index].csv"。
数据链接：IoT_20等。

5. User Authentication

问题背景：涉及企业网络中用户认证的恶意行为预测。
数据内容：包含两个不同大小的子集（节点数为50和300）。
文件格式：每个子集中的输入和输出图分别存储在.csv文件中，文件名格式为"Auth-[graph_size]-[input/output]-[index].csv"。
数据链接：Auth_50等。

6. Chemistry Reaction

问题背景：涉及化学反应预测。
数据内容：包含7180对反应物和产物分子图。
文件格式：数据存储在多个文件夹中，包括"mol_edge"和"mol_nodes"等。
数据链接：Mol_edge等。

7. Molecule Optimization

问题背景：涉及分子优化，通过匹配分子对分析（MMPA）来改善分子化学性质。
数据内容：数据集包括多个任务，如改善惩罚logP分数和药物相似性（QED）。
数据链接：Penalized logP等。

这些数据集为深度图翻译问题的研究提供了丰富的资源，适用于不同类型的图映射规则学习和应用。

搜集汇总

数据集介绍

构建方式

Scale-free Graphs数据集的构建基于无标度网络理论，其输入图通过生成具有幂律度分布的有向无标度网络来构建。目标图的生成则通过选择节点作为目标节点或源节点，并根据其入度或出度的概率进行连接，最终生成具有特定拓扑结构的目标图。数据集的五个子集分别包含10、20、50、100和150个节点的图，每个子集的输入图和目标图分别存储在不同的CSV文件中，文件中的值表示节点之间的连接情况。

特点

该数据集的特点在于其无标度网络的拓扑结构，输入图和目标图均为有向无标度图，且不包含节点特征。数据集的目标是学习从输入图的拓扑结构到目标图拓扑结构的映射规则。由于无标度网络在现实世界中广泛存在，如社交网络、互联网等，该数据集为研究复杂网络中的图翻译问题提供了重要资源。

使用方法

使用Scale-free Graphs数据集时，研究人员可以通过下载不同节点规模的子集，利用CSV文件中的邻接矩阵进行图翻译任务的训练和测试。每个文件中的值表示节点之间的连接情况，1表示存在边，0表示不存在边。该数据集适用于深度学习模型，特别是用于研究图翻译问题中的拓扑结构映射规则。通过该数据集，研究人员可以探索无标度网络中的图生成和转换机制。

背景与挑战

背景概述

Scale-free Graphs数据集由Guo等人于2018年提出，旨在解决深度图翻译问题中的“一对多”映射任务。该数据集的核心研究问题是通过深度学习技术自动学习输入图与目标图之间的映射规则，尤其关注无标度网络的拓扑结构映射。无标度网络因其节点度分布遵循幂律特性，广泛应用于社交网络、生物网络和互联网等领域。该数据集的构建基于Bollobás等人提出的无标度网络生成模型，输入图与目标图均为有向无标度图，通过特定的概率规则生成目标图。该数据集为图翻译领域的研究提供了重要的实验基础，推动了图结构生成与转换技术的发展。

当前挑战

Scale-free Graphs数据集在解决图翻译问题时面临多重挑战。首先，无标度网络的复杂拓扑结构使得输入图与目标图之间的映射规则难以捕捉，尤其是在“一对多”映射场景下，模型需要学习从单一输入图生成多个可能的目标图。其次，数据集中缺乏节点特征，仅依赖图的拓扑结构进行映射，增加了模型学习的难度。此外，构建过程中需确保生成的目标图仍满足无标度特性，这对生成算法的设计提出了较高要求。最后，数据集的规模与多样性有限，可能影响模型的泛化能力，尤其是在处理更大规模或更复杂的图结构时，模型的性能可能受到限制。

常用场景

经典使用场景

在复杂网络分析领域，Scale-free Graphs数据集被广泛应用于研究无标度网络的拓扑结构及其动态演化过程。该数据集通过生成具有幂律分布特性的有向网络，为研究者提供了一个理想的实验平台，用于探索网络中的节点连接模式及其对网络整体行为的影响。经典的使用场景包括网络拓扑的生成与演化模拟，以及基于深度学习的图翻译任务，尤其是从输入图的拓扑结构到目标图拓扑结构的映射学习。

解决学术问题

Scale-free Graphs数据集有效解决了复杂网络研究中的多个关键问题，尤其是无标度网络的生成与演化机制。通过提供不同规模的输入图和目标图对，该数据集支持研究者深入分析网络拓扑的动态变化规律，并验证基于深度学习的图翻译模型的有效性。其意义在于为复杂网络的理论研究提供了高质量的数据支持，推动了图翻译技术在网络科学中的应用，并为网络优化、社区发现等问题的解决提供了新的思路。

衍生相关工作

基于Scale-free Graphs数据集，研究者们开展了多项经典工作，尤其是在图翻译和网络生成领域。例如，Guo等人提出的深度图翻译模型（Deep Graph Translation）利用该数据集验证了从输入图到目标图的映射学习能力。此外，该数据集还被用于研究无标度网络的生成算法，如Barabási-Albert模型的改进版本，以及基于深度学习的网络拓扑优化方法。这些工作不仅推动了图翻译技术的发展，也为复杂网络的研究提供了新的工具和方法。

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集