five

mABCD (MULTILAYER ARTIFICIAL BENCHMARK FOR COMMUNITY DETECTION)

收藏
arXiv2025-07-15 更新2025-07-17 收录
下载链接:
https://github.com/KrainskiL/MLNABCDGraphGenerator.jl
下载链接
链接失效反馈
官方服务:
资源简介:
mABCD数据集是一个针对社区检测的多层人工基准数据集,它基于ABCD模型,并扩展到了多层网络。该数据集旨在解决多层网络中社区检测的复杂性问题,例如社区可能存在于多个层、层间存在依赖关系等。mABCD数据集通过模拟真实世界网络中节点度、社区大小以及层间相关性,为社区检测算法提供了一个可控的测试环境。

The mABCD dataset is a multi-layer artificial benchmark dataset for community detection, which is extended from the ABCD model to multi-layer networks. It aims to address the complexities of community detection in multi-layer networks, such as communities spanning multiple layers and inter-layer dependencies. By simulating node degrees, community sizes, and inter-layer correlations in real-world networks, the mABCD dataset provides a controllable test environment for community detection algorithms.
提供机构:
SGH Warsaw School of Economics, Warsaw, Poland; Wrocław University of Science and Technology, Wrocław, Poland; Toronto Metropolitan University, Toronto, ON, Canada; Tutte Institute for Mathematics and Computing, Ottawa, ON, Canada
创建时间:
2025-07-15
原始信息汇总

MLNABCDGraphGenerator.jl 数据集概述

数据集描述

  • 该数据集是一个用于生成多层网络(MLNABCD图)的Julia包。
  • 主要功能包括生成具有特定相关性的多层网络边和社区结构。

安装方法

julia using Pkg Pkg.add(url="https://github.com/bkamins/ABCDGraphGenerator.jl") Pkg.add(url="https://github.com/KrainskiL/MLNABCDGraphGenerator.jl")

使用说明

主文件

  • 主文件为mlnabcd_sampler.jl
  • 需要配置文件指定全局参数(示例见utils/example_config.toml

配置文件参数

参数 描述
seed RNG种子,""表示不设置种子
n 代理数量
edges_cor 边相关性矩阵文件或值
layer_params 各层参数文件
d_max_iter 度采样的最大迭代次数
c_max_iter 聚类大小采样的最大迭代次数
t 边重连的批次数
e 每批重连的边百分比
d 潜在空间维度
edges_filename 输出边文件名
communities_filename 输出社区文件名

层参数格式

示例层参数(CSV格式):

q tau r gamma delta Delta beta s S xi
1 1 1 2,5 2 25 1,5 8 32 0,2
0,75 0,75 0,75 2,5 2 25 1,5 8 32 0,2

边相关性矩阵格式

示例相关性矩阵:

1 2 3 4
1 1.0 0.15 0.15 0.12
2 0.15 1.0 0.2 0.1

输出文件格式

社区文件

community_number layer_number

  • 不活跃代理分配为社区0

边文件

agent1_label agent2_label layer_number

默认配置

最小配置参数

seed = "42" n = "1000" edges_cor = "" layer_params = "default_layer_params.csv"

默认参数值

参数 默认值
d_max_iter 1000
c_max_iter 1000
t 100
e 0.01
d 2
edges_filename edges.dat
communities_filename communities.dat

默认层参数

q tau r gamma delta Delta beta s S xi
1 0 0 2,5 2 25 1,5 8 32 0,5
搜集汇总
数据集介绍
main_image_url
构建方式
mABCD(多层社区检测人工基准)数据集是基于ABCD(人工社区检测基准)模型的多层网络扩展版本。该模型通过六个阶段构建多层网络:选择活跃节点、创建度序列、构建社区、生成边、重连自环和多边,以及调整层间边相关性。每个阶段都独立处理各层网络,同时通过参考层确保层间社区结构的关联性。该构建方法结合了配置模型和几何嵌入技术,确保了生成网络的高效性和可解释性。
特点
mABCD数据集的主要特点包括:1)多层结构,支持生成具有不同社区结构和度分布的多层网络;2)灵活的层间相关性控制,允许用户通过参数调整层间节点度、社区划分和边的相关性;3)高效的生成算法,能够在短时间内生成大规模网络;4)支持多种度分布和社区大小分布,尤其是幂律分布,以模拟真实网络的特性。这些特点使其成为评估多层社区检测算法的理想基准。
使用方法
mABCD数据集的使用方法包括:1)通过调整全局参数(如节点数、层数、边相关性矩阵)和层特定参数(如活跃节点比例、度分布幂律指数、社区大小分布等)生成定制化网络;2)利用生成的网络评估社区检测算法的性能,比较不同算法在多层网络中的表现;3)研究层间相关性对网络性质的影响,例如信息传播或社区稳定性。数据集提供了Julia和Python的实现,用户可以通过GitHub获取代码并按照指南进行配置和生成。
背景与挑战
背景概述
mABCD(多层社区检测人工基准)数据集是由Łukasz Kraiński等人于2025年提出的,旨在解决多层网络中社区检测的基准测试问题。该数据集基于ABCD模型,通过引入多层网络结构,扩展了原有模型的适用性,使其能够生成具有真实社区结构和幂律分布的多层网络。mABCD的提出填补了多层网络社区检测领域缺乏高质量基准数据集的空白,为研究者提供了一个快速、可解释且可分析的随机图模型。该数据集的核心研究问题是如何在多类型交互的复杂网络中准确识别和评估社区结构,其影响力主要体现在为社区检测算法的性能评估提供了标准化工具,推动了复杂网络分析领域的发展。
当前挑战
mABCD数据集面临的挑战主要包括两个方面:领域问题的挑战和构建过程的挑战。在领域问题方面,mABCD旨在解决多层网络中社区检测的基准测试问题,但多层网络的异构性和交互复杂性使得社区检测算法的评估变得尤为困难。在构建过程中,挑战包括如何确保生成的网络具有真实的社区结构和幂律分布,同时保持计算效率;如何在不同网络层之间建立合理的相关性;以及如何处理节点在不同层中的活跃性差异。此外,模型还需要在灵活性和可解释性之间取得平衡,以满足不同研究需求。
常用场景
经典使用场景
mABCD数据集作为多层网络社区检测的基准工具,广泛应用于复杂网络分析领域。该数据集通过生成具有已知社区结构的合成多层网络,为研究人员提供了一个可控的环境,用于测试和优化社区检测算法。其典型使用场景包括评估算法在不同网络层间的社区结构一致性、检测算法在噪声环境下的鲁棒性,以及比较不同算法在多层网络中的性能表现。
实际应用
在实际应用中,mABCD生成的合成网络被用于模拟社交媒体的用户交互模式、生物系统的分子网络以及交通网络的层级连接。例如,在社交网络分析中,研究者通过调整层间相关性参数,可以模拟跨平台(如Facebook和Twitter)的用户社区演化;在流行病学研究中,该模型能构建具有地理和社交多层次的传播网络,用于测试信息扩散策略的有效性。
衍生相关工作
基于mABCD的衍生研究包括多层网络中的信息传播模型优化、动态社区检测算法的开发,以及跨层影响力最大化问题的求解。典型工作如Bródka等人利用该框架分析了层间相关性对传播动力学的影响;Magnani团队则扩展了模块化最大化方法以适配mABCD生成的多层结构。此外,该模型启发了超图社区检测基准h-ABCD的开发,推动了复杂网络建模向更高维度的拓展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作