five

HGLFR benchmark generator

收藏
arXiv2025-03-13 更新2025-03-14 收录
下载链接:
http://arxiv.org/abs/2503.09585v1
下载链接
链接失效反馈
官方服务:
资源简介:
HGLFR基准生成器是一种扩展自广泛使用的LFR基准生成器的社区检测基准,它保留了LFR和GLFR网络的属性,并进一步引入了异质社区间连接性。该生成器能够创建具有复杂层次结构的网络,其社区结构触发解析极限,同时保持正相关的连接性。

The HGLFR benchmark generator is a community detection benchmark extended from the widely used LFR benchmark generator. It retains the core properties of both LFR and GLFR networks, and further introduces heterogeneity in inter-community connectivity. This generator can create networks with complex hierarchical structures, whose community structures push the resolution limits of community detection while maintaining positively correlated connectivity.
提供机构:
伦斯勒理工学院计算机科学与网络科学与技术中心
创建时间:
2025-03-13
搜集汇总
数据集介绍
main_image_url
构建方式
HGLFR基准生成器通过对LFR和GLFR网络的扩展,引入了分层社区结构。它通过控制网络的参数来构建网络,使其具有与真实世界网络相似的结构。HGLFR生成器首先生成节点度和社区大小的幂律分布,然后创建一个L层分层的聚类。在每个层次上,社区会根据给定的概率S随机合并,形成更高级别的社区。之后,为每个社区分配一个混合参数,该参数在层次结构的每个级别上都有所变化。最后,使用配置模型为每个社区分配内部边,并根据每个层次的混合参数为每个节点分配外部边。
特点
HGLFR数据集的特点在于它引入了分层社区结构,使得社区间的连接具有异质性。这种异质性使得网络在特定分辨率下具有模块化的结构,能够更好地模拟真实世界网络中的社区结构。此外,HGLFR数据集能够生成具有分辨率限制的网络,这对于评估社区检测算法的性能至关重要。HGLFR数据集的另一个特点是它能够生成具有负距离的网络,这意味着网络中存在强烈的社区间连接,这对于评估社区检测算法在处理真实世界网络时的性能非常有用。
使用方法
使用HGLFR数据集进行社区检测算法评估的方法包括:首先,使用HGLFR生成器生成一系列网络,并使用各种社区检测算法对这些网络进行检测。然后,通过比较算法在不同参数设置下的性能,评估算法的有效性。此外,还可以通过分析网络的度分布、社区大小分布和社区间连接的异质性等属性,来评估网络的性质和算法的适用性。
背景与挑战
背景概述
社区检测是网络科学中的一个重要研究领域,旨在识别网络中的模块或社区结构。这些社区代表了网络中节点之间的紧密连接,反映了真实世界系统中的社会、生物或技术组成部分之间的交互。社区检测在理解社交网络中的用户极化、脑神经元的交互网络以及其他生物系统中的过程等方面发挥着关键作用。为了评估社区检测算法的有效性,研究人员通常使用具有已知社区结构的合成网络进行基准测试。HGLFR基准生成器是由Brendan Cross和Boleslaw K. Szymanski等人在2025年开发的一种新的网络生成工具,它扩展了广泛使用的LFR基准生成器,引入了层次社区结构,并允许根据采样的层次结构变化社区之间的连接性。该生成器旨在模拟真实世界网络中的层次社区结构,并帮助研究人员更好地理解和评估社区检测算法的性能。
当前挑战
HGLFR基准生成器面临的挑战主要涉及两个方面:首先,该生成器旨在解决社区检测算法在处理具有层次结构的网络时的局限性,特别是那些具有异构社区连接性的网络。在真实世界中,社区之间可能存在不同程度的连接,这可能导致现有的社区检测算法无法准确识别所有社区结构。其次,在构建过程中,HGLFR生成器需要克服计算复杂性的挑战,因为生成具有层次结构和异构连接性的网络可能需要大量的计算资源。此外,生成器需要确保生成的网络能够真实地反映真实世界网络的特性,这要求对网络结构和节点连接性进行精确建模。
常用场景
经典使用场景
HGLFR benchmark generator作为社区检测领域的有力工具,其经典使用场景在于为社区检测算法提供具有已知社区结构的合成网络,以便对这些算法进行性能评估和验证。通过控制生成网络的参数,HGLFR能够创建具有层次化社区结构的网络,这些网络在大小和密度上可调,能够模拟现实世界网络中的复杂层次化社区结构。
实际应用
HGLFR benchmark generator在实际应用中,可用于社交网络分析、脑网络分析以及其他复杂系统的研究。例如,在社交网络分析中,HGLFR可以生成具有不同层次化社区结构的网络,帮助研究者更好地理解网络中不同群体之间的相互作用和影响。在脑网络分析中,HGLFR可以帮助研究者识别大脑中不同功能模块之间的层次化关系,从而揭示大脑的工作原理。此外,HGLFR还可以用于其他复杂系统的研究,如生物网络、交通网络等。
衍生相关工作
HGLFR benchmark generator的提出,推动了社区检测领域的进一步研究。在此基础上,研究者们发展了多种改进的社区检测算法,如Leiden算法、Multiscale算法等,这些算法能够更好地处理具有层次化结构的网络。此外,HGLFR的提出还促进了社区检测基准生成器的发展,如GLFR等,这些基准生成器能够生成具有更复杂结构的网络,为社区检测算法的研究提供了更多的数据支持。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作