five

ABCD+o2

收藏
arXiv2025-06-06 更新2024-06-21 收录
下载链接:
https://github.com/bkamins/ABCDGraphGenerator.jl/
下载链接
链接失效反馈
官方服务:
资源简介:
ABCD+o2是一种具有社区结构和幂律分布的随机图模型,用于生成类似于LFR模型的图,但更快、更易解释,并且可以进行理论分析。该模型通过引入异常值和重叠社区来扩展原有的ABCD模型,以更好地模拟真实世界网络的结构。数据集可以用于测试、调整和训练社区检测算法,并支持社区检测算法的开发和分析。

ABCD+o2 is a random graph model with community structure and power-law distribution. It generates graphs comparable to those produced by the LFR model, but boasts faster generation speed, greater interpretability, and is amenable to theoretical analysis. This model extends the original ABCD model by incorporating outliers and overlapping communities, thereby better simulating the structural features of real-world networks. The datasets generated using this model can be employed to test, tune, and train community detection algorithms, and facilitate the development and analysis of such algorithms.
提供机构:
Dalhousie University, Toronto Metropolitan University, Warsaw School of Economics, University of Ottawa, Tutte Institute for Mathematics and Computing
创建时间:
2025-06-06
搜集汇总
数据集介绍
main_image_url
构建方式
ABCD+o2数据集的构建基于一种创新的随机图模型,该模型通过隐式参考层生成具有重叠社区结构的网络。构建过程分为六个阶段:首先创建符合幂律分布的节点度序列,随后标记异常节点;接着在d维参考空间中生成重叠社区,通过几何接近性确定社区成员关系;然后根据节点度与社区数量的相关性参数ρ,将节点分配到社区;最后通过配置模型分别生成社区子图和背景图,并通过重连机制消除自环和多边。
特点
该数据集的核心特征在于其动态重叠社区结构和几何参考层的创新设计。通过调节参数η控制节点的平均社区归属数量,利用d维空间中的几何分布自然形成社区重叠,其重叠规模分布与真实社交网络高度吻合。数据集同时保留了ABCD模型系列的高效生成、理论可分析性等优势,并新增了节点度与社区数量的相关性控制参数ρ,使得生成网络能更精准地模拟真实系统中高度节点倾向于归属更多社区的现象。
使用方法
ABCD+o2数据集主要应用于重叠社区检测算法的基准测试。使用时需配置12项核心参数,包括网络规模n、异常节点数s0、社区重叠度η等。研究者可通过调节噪声水平ξ和重叠参数η来构建不同复杂度的测试场景,使用标准化互信息(oNMI)等指标评估算法性能。该数据集支持从社交网络分析到蛋白质相互作用研究等多个领域的算法验证,其Julia语言实现版本提供了高效的并行生成接口。
背景与挑战
背景概述
ABCD+o2数据集是由Jordan Barrett、Ryan DeWolfe、Bogumił Kamiński等研究人员于2025年提出的一种人工基准图模型,旨在为社区检测算法提供具有重叠社区和异常节点的测试环境。该数据集基于ABCD模型,通过引入隐藏的几何参考层和重叠社区机制,扩展了原有模型的功能。ABCD+o2的核心研究问题是模拟真实网络中复杂的社区结构,特别是在社交网络、蛋白质相互作用网络等场景中普遍存在的重叠社区现象。该数据集的提出为社区检测算法的评估和比较提供了更接近现实的数据基础,对网络科学和复杂系统研究领域具有重要的影响力。
当前挑战
ABCD+o2数据集面临的挑战主要包括两个方面:在解决领域问题方面,社区检测本身缺乏统一的社区定义标准,且重叠社区的存在进一步增加了检测的复杂性,如何准确评估算法在重叠社区场景下的性能是一个关键挑战;在构建过程中,设计合理的重叠社区生成机制、确保社区结构与真实网络相似性、处理高维几何参考层的计算复杂度以及平衡模型参数对结果的影响等技术难题需要克服。此外,如何在生成的数据中保持节点度与社区数量之间的相关性,同时避免社区间重叠过大或过小的问题,也是构建过程中的重要挑战。
常用场景
经典使用场景
ABCD+o2数据集在复杂网络分析领域中被广泛用于评估和比较重叠社区检测算法的性能。该数据集通过模拟真实网络中的社区结构和重叠特性,为研究者提供了一个可控且可重复的实验环境。其经典使用场景包括算法基准测试、社区检测方法的参数调优以及网络模型的验证。
实际应用
在实际应用中,ABCD+o2数据集被用于社交网络分析、生物信息学和推荐系统等多个领域。例如,在社交网络中,该数据集可以帮助识别用户在不同兴趣群体中的重叠成员关系;在生物信息学中,它可用于研究蛋白质相互作用网络中的功能模块重叠;在推荐系统中,ABCD+o2能够模拟用户在不同兴趣社区中的行为模式,从而优化个性化推荐算法。
衍生相关工作
ABCD+o2数据集衍生了一系列经典研究工作,包括基于几何参考层的社区检测算法优化、重叠社区密度分析以及噪声环境下社区检测的鲁棒性研究。此外,该数据集还被用于开发新的评估指标,如重叠标准化互信息(oNMI),以更准确地衡量算法在重叠社区检测中的性能。这些工作不仅推动了社区检测理论的发展,也为实际应用提供了重要参考。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作