DRIFT
收藏DRIFT 数据集概览
DRIFT 是一个用于任务无关持续图学习(Task-Free Continual Graph Learning)的基准测试,专注于连续分布漂移场景。该基准测试提供了统一的评估框架,适用于任务边界模糊、渐进或缺失的现实流式场景。
核心特性
- 任务无关设置:支持类增量、模糊、边界模糊、高斯过渡和时间增量等多种流式场景
- 多骨干网络:内置 GCN、GAT 和 GIN 三种图神经网络骨干
- 全面基线方法:包含 9 种持续学习方法,涵盖基于回放、正则化和联合训练等类型
- 标准化数据集:提供多个标准化的持续学习图数据集版本
支持的数据集
| 数据集 | 类型 | 用途 |
|---|---|---|
| CoraFull-CL | 引文网络 | 任务无关流式学习 |
| Arxiv-CL | 引文网络 | 任务无关/时间流式学习 |
| Reddit-CL | 社交网络 | 任务无关流式学习 |
| RomanEmpire-CL | 异质图 | 任务无关流式学习 |
支持的模型与方法
| 方法 | 类型 | 说明 |
|---|---|---|
| bare | 下界 | 朴素序贯微调 |
| joint | 上界 | 所有任务联合训练 |
| mas | 正则化 | 记忆感知突触 |
| tfmas | 正则化 | 任务无关 MAS |
| agem | 回放 | 平均梯度片段记忆 |
| er | 回放 | 经验回放 |
| gss | 回放 | 基于梯度的样本选择 |
| ssm | 回放 | 稀疏子图记忆 |
| dmsg | 回放 | 解耦记忆子图 |
| sem | 回放 | 结构演化记忆 |
支持的设置
| 设置参数 | 描述 |
|---|---|
| tfocis | 任务无关类增量流 |
| tfo | 通过类别重叠实现模糊任务 |
| tfo_bb | 边界模糊:混合相邻任务批次样本 |
| tfo_gaussian | 高斯加权连续任务过渡 |
评估指标
- 最终准确率 (FA):最后一个任务后的平均准确率
- 反向迁移 (AF):新任务对先前任务的影响
- 前向迁移 (FWT):对未见任务的零样本迁移能力
- AAUC:整个流式过程中的平均准确率
- FM/AF_s:流结束时与峰值准确率的下降量
快速使用示例
高斯连续过渡: bash python main.py --dataset CoraFull-CL --backbone GCN --method sem --setting tfo_gaussian --gaussian_sigma 20.0
全局模糊: bash python main.py --dataset Arxiv-CL --backbone GCN --method ssm --setting tfo_blurry --percentage 0.9
边界模糊: bash python main.py --dataset CoraFull-CL --backbone GCN --method dmsg --setting tfo_bb --blurry_batch_count 5 --boundary_mix_ratio 0.5
类增量流: bash python main.py --dataset CoraFull-CL --backbone GCN --method er --setting tfocis
时间增量流: bash python main.py --dataset Arxiv-CL --backbone GCN --method er --time_streaming True --n_time_tasks 20
相关论文
该基准测试基于 CGLB(Zhang 等人,NeurIPS 2022)扩展而来,新增了任务无关场景和连续分布漂移设置。若使用本数据集,请引用相关论文:
bibtex @article{drift2026, title={DRIFT: A Benchmark for Task-Free Continual Graph Learning under Continuous Transitions}, author={Guiquan Sun, Xikun Zhang, Jingchao Ni, Dongjin Song}, journal={arXiv preprint arXiv:2605.12998}, year={2026} }




