OPBench
收藏OPBench 数据集概述
数据集简介
OPBench 是一个全面的基于图的基准测试,旨在为对抗阿片类药物危机的研究提供支持。它为评估图神经网络、异构图神经网络和超图神经网络在药物相关检测与分类任务上的性能提供了一个统一框架。
数据集构成
OPBench 包含 5 个精心策划的数据集,涵盖异构图、超图和多关系图:
| 数据集 | 类型 | 节点数 | 边数 | 特征维度 | 类别数 | 任务 |
|---|---|---|---|---|---|---|
| PDMP | 异构图 | 85,908 | 1.2M+ | 768 | 2 | 阿片类药物过量检测 |
| NHANCE | 异构图 | 12,453 | 89K+ | 768 | 2 | 饮食角色分类 |
| Twitter-HyDrug-Role | 超图 | 3,591 | 11,940 | 200 | 4 | 药物角色检测 |
| Twitter-HyDrug-Comm | 超图 | 3,591 | 11,940 | 200 | 8 | 社区检测(多标签) |
| Twitter-MRDrug-Role | 多关系图 | 27,945 | 436K+ | 384 | 4 | 药物角色检测 |
数据集详情
PDMP(处方药监控计划)
一个基于处方记录构建的异构图,包含 4 种节点类型:
- 患者:用于过量预测的目标节点
- 处方者:医疗服务提供者
- 药房:配药地点
- 药物:处方药物
Twitter 数据集
用于药物相关行为分析的社交媒体数据:
- HyDrug-Role/Comm:用户交互的超图表示
- MRDrug-Role:包含 3 种边类型(关键词、关注、推文)的多关系图
NHANCE
一个用于营养与健康分析的异构图,节点类型包括:用户、食物、成分、类别、习惯。
支持模型
标准图神经网络
- GCN - 图卷积网络
- GAT - 图注意力网络
- GraphSAGE - 采样与聚合网络
- GIN - 图同构网络
异构图神经网络
- HAN - 异构图注意力网络
- HGT - 异构图变换器
- RGCN - 关系图卷积网络
- HGMAE - 异构图掩码自编码器
超图神经网络
- HGNN - 超图神经网络
- HyperGCN - 超图卷积
- AllSet - AllSet 变换器
- ED-HNN - 等变超图神经网络
- HNHN - 具有超边神经元的超图网络
项目结构
OPBench/ ├── configs/ │ ├── run/ # 单次运行配置 │ └── sweep/ # 超参数扫描配置 ├── datasets/ │ ├── hetgraphs/ # 异构图数据集 │ ├── hypergraphs/ # 超图数据集 │ └── graphs/ # 标准图数据集 ├── src/ │ ├── data/ # 数据加载与处理 │ ├── models/ # 模型实现 │ ├── train/ # 训练逻辑 │ ├── metrics/ # 评估指标 │ ├── hparams/ # 配置管理 │ └── main.py # 程序入口 └── outputs/ # 实验结果
输出结构
结果保存在 ./outputs/<run_name>/ 目录下:
outputs/<run_name>/ ├── config/ # 保存的配置 ├── pretrain/ # 预训练检查点(如适用) ├── finetune/ # 微调检查点 ├── eval/ # 评估结果 │ ├── run_results.json │ └── run_results.md └── logs/ # 训练日志
许可证
本项目采用 MIT 许可证。详情见 https://github.com/Tianyi-Billy-Ma/OPBench/blob/main/LICENSE 文件。




