Dynamic Network Datasets
收藏github2025-04-30 更新2025-05-01 收录
下载链接:
https://github.com/4AlexMin/dynamic-networks
下载链接
链接失效反馈官方服务:
资源简介:
该存储库包含一个结构化的79个动态(时间)网络数据集的集合。这些数据集涵盖了人类和非人类领域,具有一致的格式、标准化的命名和分层的文件夹结构,以支持可重复性和重用。每个数据集记录了实体(节点)之间的交互或连接随时间的变化。特别是,一些非人类数据集是基于从动物社会行为领域的原始研究文章中提取的信息手动收集和精心重新格式化的。
This repository encompasses a structured collection of 79 dynamic (temporal) network datasets, spanning both human and non-human domains. These datasets feature a consistent format, standardized naming conventions, and a hierarchical folder structure to facilitate reproducibility and reusability. Each dataset records the temporal variations in interactions or connections between entities (nodes). Notably, some non-human datasets are manually curated and meticulously reformatted from original research articles in the field of animal social behavior.
创建时间:
2025-04-28
原始信息汇总
Dynamic Network Datasets 数据集概述
数据集基本信息
- DOI: 10.5281/zenodo.15294830
- 类型: 动态(时序)网络数据集
- 格式: 纯文本文件,每行表示一个时序边(nodeA nodeB timestamp)
- 数据集总数: 79个(50个人类网络 + 29个非人类网络)
数据集分类
人类网络 (50个)
-
引用网络 (Citation Networks)
- 包含6个数据集(如cit-HepPh、cit-HepTh等)
- 节点数: 17,998 - 46,986
- 边数: 17,027 - 347,414
- 来源: SNAP
-
交互数字社区 (Interactive Digital Communities)
- 包含13个数据集(如digg-friends、fbno-walls等)
- 节点数: 7,301 - 545,196
- 边数: 65,053 - 1,729,983
- 来源: Network Repository、WoSNet、SNAP
-
通信网络 (Communication Networks)
- 包含10个数据集(如CollegeMsg、email-Eu-Dept1等)
- 节点数: 89 - 34,761
- 边数: 12,216 - 332,334
- 来源: SNAP、Network Repository
-
推荐网络 (Recommendation Networks)
- 包含9个数据集(如soc-epinion-combined、soc-sign-bitcoin-alpha等)
- 节点数: 3,783 - 131,828
- 边数: 24,186 - 841,372
- 来源: Network Repository、SNAP
-
物理接触网络 (Physical Contacts)
- 包含5个数据集(如SFHH-conf、hypertext-conf等)
- 节点数: 113 - 10,972
- 边数: 17,298 - 415,912
- 来源: SocioPatterns、Network Repository
-
其他 (Others)
- 包含7个数据集(如fbno-links、high-school-2011等)
- 节点数: 126 - 61,096
- 边数: 28,561 - 905,565
- 来源: WoSNet、SocioPatterns、Network Repository
非人类网络 (29个)
- 分类:
- Aves(鸟类)
- Insecta(昆虫类)
- Mammalia(哺乳类)
- Reptilia(爬行类)
- 来源: ASNR仓库和动物行为研究论文手动收集
文件夹结构
./ ├── human/ │ ├── Citation Networks/ │ ├── Communication Networks/ │ ├── Interactive Digital Communities/ │ ├── Recommendation Networks/ │ ├── Physical Contacts/ │ └── Others/ └── non-human/ ├── aves/ ├── insecta/ ├── mammalia/ └── reptilia/
许可证
- 代码和文档: MIT License
- 数据集: 遵循原始来源的许可证(如SocioPatterns数据集使用CC BY-NC 4.0许可证)
搜集汇总
数据集介绍

构建方式
Dynamic Network Datasets的构建采用了系统化、标准化的方法,涵盖了人类和非人类两大领域的动态网络数据。人类网络数据主要来源于SNAP、Network Repository、SocioPatterns等知名公共数据仓库,而非人类网络数据则通过手工收集和整理动物行为研究文献中的原始数据。所有数据均以统一的文本格式存储,每行记录一个时间边,包含节点A、节点B和时间戳三个要素。数据按照网络类型和特征进行层次化分类存储,确保了数据的可追溯性和可重用性。
特点
该数据集最显著的特点在于其广泛覆盖性和精细分类。包含50个人类网络和29个非人类网络,涉及引文网络、通信网络、数字社区、推荐网络、物理接触等多种类型。非人类网络进一步细分为哺乳动物、鸟类、爬行动物和昆虫四大类。每个数据集都提供了节点数、边数、平均度等关键指标,便于研究者快速了解网络特性。数据采用标准化命名和层次化文件夹结构,极大提升了数据检索和使用效率。
使用方法
使用该数据集时,研究者可根据研究需求选择相应类别的网络数据。数据以纯文本格式存储,可直接用常规编程语言读取和处理。人类网络数据适合研究社交网络演化、信息传播等课题,而非人类网络则为动物行为学研究提供了宝贵资源。使用时需注意遵守原始数据源的许可协议,特别是来自SocioPatterns的数据需遵循CC BY-NC 4.0许可。数据集采用MIT许可证,但第三方数据需遵循其原始许可条款。
背景与挑战
背景概述
Dynamic Network Datasets是由多领域研究者联合构建的动态网络数据集集合,发布于Zenodo平台,旨在为复杂网络分析提供标准化、结构化的时序网络数据资源。该数据集由人类交互网络与非人类生物网络两大模块构成,涵盖引文网络、社交平台交互、动物行为学观测等多元场景,数据源自SNAP、Network Repository等权威开放数据库,并经过严格的清洗与格式统一处理。其层级化的分类体系与精确到毫秒级的时间戳记录,为网络演化动力学、群体行为模式挖掘等前沿研究提供了重要基准。
当前挑战
该数据集面临的核心挑战体现在两个维度:在科学问题层面,动态网络的高维时空特性使得传统静态网络分析方法失效,需开发新型时序嵌入与动态社区发现算法;在构建技术层面,原始数据存在时间分辨率不一致(如动物行为观测的稀疏采样)、跨平台数据格式异构(如SNAP与SocioPatterns的日志结构差异)等问题,需通过人工标注与时间对齐算法实现标准化。非人类网络部分尤其艰巨,涉及从动物行为学论文中提取交互数据并转化为统一的三元组格式,这对领域专业知识与数据工程能力提出双重挑战。
常用场景
经典使用场景
在复杂网络分析领域,Dynamic Network Datasets为研究者提供了丰富的时空网络数据资源。该数据集最经典的使用场景是用于研究网络动态演化规律,例如通过分析人类社交网络中的时间戳交互数据,揭示信息传播路径和社群结构变化;在动物行为学研究中,这些数据能够帮助科学家理解群体协作机制和社会层级形成过程。
解决学术问题
该数据集有效解决了动态网络建模中的基准数据缺失问题。其标准化格式和跨领域特性支持了网络科学中关键问题的研究,包括链路预测的时序特征提取、动态社区发现算法的验证、以及网络韧性随时间演化的量化分析。特别是通过整合人类与非人类网络数据,为比较社会学与行为生态学的交叉研究提供了独特视角。
衍生相关工作
基于该数据集已产生多项重要研究成果,包括动态网络表示学习框架TDNE、时序链路预测模型TemporalGAT等。在顶级会议如KDD、WWW上发表的系列论文,通过引用这些数据集验证了动态图神经网络的有效性。其哺乳动物社交网络子集更催生了《Nature Communications》关于群体智能演化的重要研究。
以上内容由遇见数据集搜集并总结生成



