Microsoft Academic Graph with HOI, Temporal Social Network with HOI, Human Triadic PPI Dataset, Cancer Datasets with HOI, Macaque Brain Networks with HOI, Organic Photovoltaic Dataset, PubChemQC Dataset v2, USPTO-50K datasets
收藏github2025-02-18 更新2025-02-21 收录
下载链接:
https://github.com/Data-MzL/Awesome-Higher-Order-Interactions-with-AI
下载链接
链接失效反馈官方服务:
资源简介:
Microsoft Academic Graph with HOI是一个包含高阶交互的学术合作网络数据集;Temporal Social Network with HOI是一个包含时间戳和社会网络高阶交互的数据集;Human Triadic PPI Dataset是一个包含人类蛋白质-蛋白质相互作用网络中三元组交互的数据集;Cancer Datasets with HOI是包含癌症相关高阶交互的数据集;Macaque Brain Networks with HOI是一个包含猕猴大脑网络中高阶交互的数据集;Organic Photovoltaic Dataset是一个包含有机光伏材料中高阶分子交互的数据集;PubChemQC Dataset v2是一个包含量子化学计算结果的数据集,包含分子间的高阶交互;USPTO-50K datasets是一个包含美国专利和商标局授权的50K个专利数据集,包含高阶分子交互。
Microsoft Academic Graph with HOI is a dataset that encompasses a network of academic collaborations characterized by high-order interactions; Temporal Social Network with HOI is a dataset featuring timestamped social networks with high-order interactions; Human Triadic PPI Dataset is a collection of datasets depicting triadic interactions within the human protein-protein interaction network; Cancer Datasets with HOI are datasets that include high-order interactions relevant to cancer research; Macaque Brain Networks with HOI is a dataset that captures high-order interactions within the macaque brain networks; Organic Photovoltaic Dataset is a dataset containing high-order molecular interactions within organic photovoltaic materials; PubChemQC Dataset v2 is a dataset that includes quantum chemistry computation results with intermolecular high-order interactions; USPTO-50K datasets are datasets that contain 50K patents authorized by the United States Patent and Trademark Office, featuring high-order molecular interactions.
创建时间:
2025-02-11
原始信息汇总
Awesome-Higher-Order-Interactions-with-AI 数据集概述
数据集简介
- 主题:高阶交互(HOI)在复杂网络中的应用
- 内容:包含HOI相关的研究论文、常用数据集和工具
数据集分类
1. Surveys for HOI(HOI综述)
| 论文标题 | 发表平台 | 年份 | 代码 |
|---|---|---|---|
| Networks beyond pairwise interactions: Structure and dynamics | Physics Reports | 2020 | - |
| A Survey on Hypergraph Neural Networks: An In-Depth and Step-by-Step Guide | KDD | 2024 | - |
| Topological Data Analysis in Graph Neural Networks: Surveys and Perspectives pham2025topological | TNNLS | 2025 | - |
| Architectures of Topological Deep Learning: A Survey of Message-Passing Topological Neural Networks | Arxiv | 2023 | code |
2. Datasets of HOI(HOI数据集)
| 网络类型 | 描述 | 示例 | 数据集 |
|---|---|---|---|
| Social Networks | 社交网络由个体及其关系组成,高阶交互涉及多个个体之间的复杂动态 | 1. Collaboration Networks<br>2. Workplace Social Network <br>3. Campus Social Network | 1. Microsoft Academic Graph with HOI<br>2. Temporal Social Network with HOI |
| Biological Networks | 生物网络映射基因、蛋白质和细胞等实体之间的复杂关系,高阶交互反映多个实体之间的非线性合作 | 1. Protein Interaction Network<br>2. Brain Network<br>3. Gene Regulatory Network | 1. Human Triadic PPI Dataset<br>2. Cancer Datasets with HOI<br>3. Macaque Brain Networks with HOI |
| Chemical Molecular Networks | 化学分子网络将分子表示为节点,其成对相互作用表示为边,高阶交互涉及三个或更多原子或基团 | 1. Conjugated Polymers<br>2. Polycentric Bond<br>3. Dependencies between Leaving Groups | 1. Organic Photovoltaic Dataset<br>2. PubChemQC Dataset v2<br>3. USPTO-50K datasets |
3. Tools of HOI(HOI工具)
| 名称 | 环境 | 领域 | 功能 | 代码 |
|---|---|---|---|---|
| HyperNetX | Python | Hypergraphs | Analysis, Visualization | Code |
| Hypergraphx | Python | Hypergraphs | Construction, Analysis, Visualization | Code |
| XGI | Python | Hypergraphs, SCs | Modelling, Analysis, Visualization | Code |
| giotto-ph | C++ | Vietoris-Rips SCs | Persistent homology | Code |
| scikit-tda | Python, scikit-learn | SCs | TDA | Code |
| GUDHI | C++, Python | SCs | TDA | Code |
| Teaspoon | Python | Dynamic Systems, Graphs, SCs | Topological signal processing | Code |
| TDA.jl | Julia | SCs | TDA | Code |
| JuliaTDA | Julia | SCs | TDA | Code |
| JavaPlex | Java, Matlab | SCs | Persistent homology | Code |
| giotto-tda | Python, scikit-learn | SCs | TML | Code |
| TopologyLayer | Python, Pytorch | SCs | TDL, Persistent homology | Code |
| giotto-deep | Python, Pytorch | SCs | TDL | Code |
| torch-tda | Python, Pytorch | SCs | Automatic differentiation, TDA | Code |
| torch_topological | Python, Pytorch | SCs | TML | Code |
| TopoX | Python, Pytorch | SCs, CellCs, CCs | TML | Code |
| DHG | Python, Pytorch | Graphs, Hypergraphs | Deep learning | Code |
| TopoBenchmarkX | Python, Pytorch | Graphs, Hypergraphs, SCs, CellCs, CCs | Benchmark | Code |
4. Related research paper of HOI(HOI相关研究论文)
-
Pattern-based Generative Model
-
Diffusion-based Generative Model
- HYGENE (Preprint2024) GitHub
- DDE (Preprint2025) -
-
Statistical Inference Method
-
Information-Theoretic Approach for HOI
-
Learning-based Method for HOI
- DCM (ICLR2024) GitHub
- SHyRe (ICLR2024) -
-
HOT Aware Feature Extraction
-
Message Passing for HOT
-
Spectral-based Learning for HOT
搜集汇总
数据集介绍

构建方式
本数据集的构建主要针对高阶交互网络,涵盖了多种类型的网络,如社会网络、生物网络和化学分子网络。社会网络数据集如Microsoft Academic Graph with HOI通过收集学术合作关系构建;生物网络数据集如Human Triadic PPI Dataset通过映射基因、蛋白质等生物实体的复杂关系构建;化学分子网络数据集如PubChemQC Dataset v2则通过表示分子的节点及其相互作用构建。
特点
该数据集的特点在于它包含了多种不同类型的高阶交互网络,不仅涵盖了传统的社会和生物网络,还包含了化学分子网络,为研究提供了丰富的数据资源。此外,这些数据集均涉及高阶交互,即三个或更多节点之间的复杂关系,这对于理解和建模复杂系统的动态行为尤为重要。
使用方法
使用这些数据集时,研究人员可以根据具体的研究需求选择相应的网络类型。例如,使用Microsoft Academic Graph with HOI进行学术合作关系分析时,可以利用HyperNetX等工具进行网络分析和可视化;在生物网络分析中,可以使用XGI等工具进行建模和分析;而在化学分子网络分析中,可以利用PubChemQC Dataset v2进行分子的表征和性质预测。
背景与挑战
背景概述
Microsoft Academic Graph with HOI、Temporal Social Network with HOI、Human Triadic PPI Dataset、Cancer Datasets with HOI、Macaque Brain Networks with HOI等数据集,均隶属于高阶交互网络(Higher-Order Interactions, HOI)的研究领域。这些数据集的创建旨在推动复杂网络中高阶交互的研究,涵盖了社会网络、生物网络、化学分子网络等多个领域。它们的构建时间为近年来,主要研究人员和机构包括多个高校和研究机构,如普林斯顿大学、斯坦福大学等。这些数据集的核心研究问题是探索网络中节点间复杂交互模式及其对网络结构和功能的影响,对相关领域如社会网络分析、生物信息学、化学信息学等产生了重要影响。
当前挑战
这些数据集在构建和应用过程中面临的挑战主要包括:1) 高阶交互的识别和建模,相较于传统的成对交互,高阶交互涉及多个节点的复杂关系,难以直接观测和量化;2) 数据集的规模和多样性,大规模且多样化的数据集对于算法研究和模型训练至关重要,但构建此类数据集需要大量时间和资源;3) 高阶交互数据的获取和标注,由于涉及多个实体的相互作用,数据的获取和准确标注存在一定难度;4) 高阶交互分析工具和方法的发展,需要开发新的算法和工具来处理和分析高阶交互数据,以揭示更深层次的网络特性。
常用场景
经典使用场景
在复杂网络的领域中,Microsoft Academic Graph with HOI等数据集提供了包含高阶交互的社交网络结构,这些数据集被广泛用于分析和理解多节点间的复杂关系。经典使用场景包括在学术社交网络中挖掘合作模式,以及识别科研合作中的关键人物和潜在的合作关系。
实际应用
实际应用中,这些数据集可用于改善社交网络服务,如推荐系统,通过分析用户间的高阶交互来提供更准确的推荐。在化学分子网络领域,高阶交互分析有助于理解分子的复杂结构,为新材料的发现和设计提供了理论基础。
衍生相关工作
基于这些数据集,研究者开发了多种方法和工具,如HyperNetX和Hypergraphx等,用于高阶交互网络的分析和可视化。此外,还涌现了大量研究工作,如PCN和CIN++等,它们在高阶交互网络的表示学习和模型构建方面取得了显著进展。
以上内容由遇见数据集搜集并总结生成



