five

KONECT-Social-Network-Datasets

收藏
github2020-10-31 更新2024-05-31 收录
下载链接:
https://github.com/ShanLu1984/KONECT-Social-Network-Datasets
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含了从KONECT下载的社交网络数据,用于研究社交网络的联合度分布特征,并与传统网络如Web链接和引用网络进行对比。数据集包括Facebook墙贴、Youtube链接和英文维基百科讨论等子数据集。

This dataset comprises social network data downloaded from KONECT, utilized for investigating the joint degree distribution characteristics of social networks and comparing them with traditional networks such as web links and citation networks. The dataset includes sub-datasets like Facebook wall posts, YouTube links, and English Wikipedia discussions.
创建时间:
2017-10-12
原始信息汇总

数据集概述

数据集来源

  • 数据集来自KONECT(Koblenz Network Collection),包含多种类型的网络数据集。

数据集内容

  • 数据集主要包含社交网络的联合度(入度和出度)分布信息。
  • 项目包括从KONECT网站下载的TSV文件中提取度信息和数据可视化。

数据集工具

  • network_read.m: 用于获取网络中节点的入度和出度,输出为degrees.mat,包含节点度信息的矩阵。
  • network_show.m: 用于绘制节点联合度分布图,展示入度和出度的相关性。
  • overlap_fraction.m: 用于计算并展示顶部x%节点的重叠百分比,反映入度和出度的渐近依赖性。

数据集示例

  • Facebook wall posts: 包含46,952个用户,876,993条边,平均度为37.357,互惠性为62.5%。
  • Youtube links: 包含1,138,499个用户,4,942,297条边,平均度为8.6821,互惠性为79.0%。
  • Wikipedia talk, English: 包含2,987,535个用户,24,981,163条边,平均度为16.724,互惠性为21.5%。
  • Flickr Friendship: 包含2,302,925个用户,33,140,017条边,平均度为28.781,互惠性为62.2%。
  • LiveJournal Friendship: 包含4,847,571个用户,68,475,391条边,平均度为28.251,互惠性为74.8%。
  • Google Hyperlink: 包含875,713个网页,5,105,039条边,平均度为11.659,互惠性为30.7%。

运行指南

  1. 选择感兴趣的数据集,从KONECT网站下载TSV文件。
  2. 解压.tar文件。
  3. 根据数据集修改network_read.mnetwork_show.moverlap_fraction.m中的代码。
  4. 在命令窗口运行相应的脚本以读取、展示和分析数据。
搜集汇总
数据集介绍
main_image_url
构建方式
KONECT-Social-Network-Datasets数据集的构建源于对社交网络联合度分布特征的深入研究。研究者通过从KONECT(Koblenz Network Collection)下载多种社交网络数据,提取节点入度和出度信息,并利用二维数学生成模型模拟社交网络的演化过程。通过对比生成模型产生的合成数据与真实网络数据,验证了模型的有效性。数据集涵盖了多个知名社交平台的数据,如Facebook、Youtube、Wikipedia等,确保了数据的多样性和广泛性。
特点
该数据集的特点在于其涵盖了多个社交网络的联合度分布信息,包括入度和出度的相关性分析。数据集中的网络规模从数万到数百万节点不等,反映了不同社交平台的用户互动模式。此外,数据集还提供了节点重叠比例的计算,揭示了高入度和高出度节点之间的渐近依赖性。这些特征使得该数据集成为研究社交网络结构和演化的宝贵资源。
使用方法
使用KONECT-Social-Network-Datasets时,首先需从KONECT网站下载感兴趣的TSV文件并解压。随后,通过修改network_read.m文件中的参数,提取特定数据集的节点入度和出度信息。接着,利用network_show.m文件绘制联合度分布图,并通过overlap_fraction.m文件分析节点重叠比例。这些步骤帮助用户深入理解社交网络的度分布特征及其演化规律。
背景与挑战
背景概述
KONECT-Social-Network-Datasets数据集由Koblenz Network Collection项目创建,旨在收集和分析各类大规模网络数据。该数据集特别关注社交网络的联合度分布特性,与传统网页超链接和引用网络相比,社交网络的联合度分布具有独特特征。研究人员通过提出二维数学生成模型,捕捉社交网络中联合度的演化过程,并通过模拟实验验证模型的有效性。该数据集的研究成果在2015年的NetSci会议和2016年的ACC会议上发表,对社交网络分析领域产生了深远影响。
当前挑战
KONECT-Social-Network-Datasets数据集在解决社交网络联合度分布问题时面临诸多挑战。首先,社交网络的联合度分布具有复杂性和多样性,传统的生成模型难以准确捕捉其演化规律。其次,数据集的构建过程中,研究人员需要从KONECT网站下载TSV文件并提取节点度信息,这一过程涉及大规模数据处理和复杂的计算任务。此外,数据可视化与分析过程中,如何有效展示联合度分布的依赖关系以及节点度之间的渐近依赖性,也是该数据集面临的重要技术挑战。
常用场景
经典使用场景
KONECT-Social-Network-Datasets数据集广泛应用于社交网络分析领域,特别是在研究社交网络中的联合度分布特性时。通过分析节点入度和出度的联合分布,研究者能够深入理解社交网络中的信息传播模式和用户互动行为。该数据集的使用场景包括社交网络结构建模、用户行为预测以及网络演化分析等。
实际应用
KONECT-Social-Network-Datasets在实际应用中具有广泛的价值。例如,社交媒体平台可以利用该数据集优化推荐系统,提升用户互动体验;网络安全领域则可以通过分析网络结构,识别潜在的恶意用户或异常行为。此外,该数据集还为社交网络中的广告投放策略和用户群体分析提供了数据基础。
衍生相关工作
基于KONECT-Social-Network-Datasets,研究者们开展了多项经典工作。例如,利用该数据集提出的二维生成模型,成功模拟了社交网络的演化过程,并在NetSci 2015和ACC 2016会议上发表。此外,该数据集还催生了大量关于社交网络结构分析、用户行为预测以及信息传播模型的研究,推动了社交网络分析领域的进一步发展。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作